[14 minut čtení] Fulltextové hledání Seznamu prošlo během prvního čtvrtletí tohoto roku významnou technologickou proměnou, která měla dle našich interních měření i AB testů poměrně velký vliv na jeho kvalitu. Než se pustíme do nových technologií, pojďme si krátce připomenout klasický přístup k fulltextovému hledání, jehož základem je invertovaný index. V invertovaném indexu jsou uložena slova a ke každému slovu pak seznam dokumentů, které ho obsahují. Po zadání uživatelského dotazu se hledají dokumenty obsahující všechna jeho slova. V podstatě se tedy jedná o hledání klíčových slov, která uživatel zadal. Tento přístup k fulltextovému hledání má však několik docela zásadních omezení. https://www.root.cz/clanky/jazykove-modely-pro-vyhledavani-naucte-stroj-chapat-vyznam-jazyka/?utm_source=rss&utm_medium=text&utm_campaign=rss
Login to add comment
Other posts in this group

Už jen pár dní zbývá do vydání Linuxu 6.16 a tak se opět zaměřme na jádro příští, verzi 6.17, jejíž novinky doprovodí i mnohá vylepšení v projektu Mesa. https://www.root.cz/clanky/jadro-verze-6-17-a-n

S aplikacemi a službami využívajícími umělou inteligenci se v posledních letech můžeme setkat doslova na každém kroku. Dnes se seznámíme s nástrojem CodeRabbit, jenž analyzuje změny ve zdrojových kóde

Pravidelná sonda do světa software. Podíváme se na nástroj pro výpis detailních informací o paměti, napojíme se na lokálně spuštěné API pro práci s jazykovými modely a nakonec budeme spravovat konfigu

Už jsme si uvedli, jak lze CORDIC použít pro výpočet goniometrických funkcí s hodnotami ve formátu plovoucí řádové binární čárky. Tentýž algoritmus lze upravit i pro práci s formátem pevné řádové biná

Vydání Debianu 13 (Trixie) bylo stanoveno na 9. srpna 2025. Po 10 letech vývoje firma Intel ukončuje podporu Clear Linuxu. Ubuntu 25.10 pro Raspberry Pi se bude dodávat s minimální sadou předinstalova

Podíváme se na mezinárodně koordinovaný zásah proti skupině NoName057(16), kritickou zranitelnost v Cisco ISE umožňující získat root a na rádiovou slabinu, která umožňuje zastavit americký vlak. https

Týden v KDE a kulaté spodní rohy oken přímo od KWin, nové AVX-512 optimalizace v FFmpeg a až 36× zrychlení některých operací, Intel Compute Runtime 25.27.34303.5 s Wildcat Lake a Battlemage G31. https