Local LLM inference – impressive but too hard to work with

созданный 11d | 21 апр. 2025 г., 19:10:21


Войдите, чтобы добавить комментарий

Другие сообщения в этой группе

The History of Album Art
2 мая 2025 г., 19:30:12 | Hacker news
Show HN: Blast – Fast, multi-threaded serving engine for web browsing AI agents

Hi HN!

BLAST is a high-performance serving engine for browser-augmented LLMs, designed to make deploying web-browsing AI easy, fast, and cost-manageable.

The goal with BLAST is to ultimately a

2 мая 2025 г., 19:30:11 | Hacker news