Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference

Utworzony 6mo | 19 lis 2024, 02:30:12


Zaloguj się, aby dodać komentarz