Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference

Erstellt 6mo | 19.11.2024, 02:30:12


Melden Sie sich an, um einen Kommentar hinzuzufügen