[14 minut čtení] Fulltextové hledání Seznamu prošlo během prvního čtvrtletí tohoto roku významnou technologickou proměnou, která měla dle našich interních měření i AB testů poměrně velký vliv na jeho kvalitu. Než se pustíme do nových technologií, pojďme si krátce připomenout klasický přístup k fulltextovému hledání, jehož základem je invertovaný index. V invertovaném indexu jsou uložena slova a ke každému slovu pak seznam dokumentů, které ho obsahují. Po zadání uživatelského dotazu se hledají dokumenty obsahující všechna jeho slova. V podstatě se tedy jedná o hledání klíčových slov, která uživatel zadal. Tento přístup k fulltextovému hledání má však několik docela zásadních omezení. https://www.root.cz/clanky/jazykove-modely-pro-vyhledavani-naucte-stroj-chapat-vyznam-jazyka/?utm_source=rss&utm_medium=text&utm_campaign=rss
Ak chcete pridať komentár, prihláste sa
Ostatné príspevky v tejto skupine

Pravidelná sonda do světa software. Podíváme se na nástroj pro výpis detailních informací o paměti, napojíme se na lokálně spuštěné API pro práci s jazykovými modely a nakonec budeme spravovat konfigu

Už jsme si uvedli, jak lze CORDIC použít pro výpočet goniometrických funkcí s hodnotami ve formátu plovoucí řádové binární čárky. Tentýž algoritmus lze upravit i pro práci s formátem pevné řádové biná

Vydání Debianu 13 (Trixie) bylo stanoveno na 9. srpna 2025. Po 10 letech vývoje firma Intel ukončuje podporu Clear Linuxu. Ubuntu 25.10 pro Raspberry Pi se bude dodávat s minimální sadou předinstalova

Podíváme se na mezinárodně koordinovaný zásah proti skupině NoName057(16), kritickou zranitelnost v Cisco ISE umožňující získat root a na rádiovou slabinu, která umožňuje zastavit americký vlak. https

Týden v KDE a kulaté spodní rohy oken přímo od KWin, nové AVX-512 optimalizace v FFmpeg a až 36× zrychlení některých operací, Intel Compute Runtime 25.27.34303.5 s Wildcat Lake a Battlemage G31. https

Zatímco prodejny repasovaných počítačů v ČR se plní relativně drahými starými stroji vyřazenými z kanceláří, Číňané ve velkém vyrábějí nové desky a DDR4 ECC moduly pro staré mnohojádrové Xeony a úak t

Zabývat se budeme sice na první pohled relativně snadnou otázkou, která však má několik odpovědí: které vektory jsou podobné a které nikoli. Odpověď závisí na tom, jakou metriku při porovnávání vektor