Why the 737 MAX has been such a headache for Boeing



Войдите, чтобы добавить комментарий

Другие сообщения в этой группе

Show HN: KVSplit – Run 2-3x longer contexts on Apple Silicon

I discovered that in LLM inference, keys and values in the KV cache have very different quantization sensitivities. Keys need higher precision than values to maintain quality.

I patched llama.cp

16 мая 2025 г., 21:50:10 | Hacker news