Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference

Vytvořeno 6mo | 19. 11. 2024 2:30:12


Chcete-li přidat komentář, přihlaste se