[14 minut čtení] Fulltextové hledání Seznamu prošlo během prvního čtvrtletí tohoto roku významnou technologickou proměnou, která měla dle našich interních měření i AB testů poměrně velký vliv na jeho kvalitu. Než se pustíme do nových technologií, pojďme si krátce připomenout klasický přístup k fulltextovému hledání, jehož základem je invertovaný index. V invertovaném indexu jsou uložena slova a ke každému slovu pak seznam dokumentů, které ho obsahují. Po zadání uživatelského dotazu se hledají dokumenty obsahující všechna jeho slova. V podstatě se tedy jedná o hledání klíčových slov, která uživatel zadal. Tento přístup k fulltextovému hledání má však několik docela zásadních omezení. https://www.root.cz/clanky/jazykove-modely-pro-vyhledavani-naucte-stroj-chapat-vyznam-jazyka/?utm_source=rss&utm_medium=text&utm_campaign=rss
Login to add comment
Other posts in this group

Tým Rhino Linux oznámil partnerství s UBports. Alpine se snaží zjednodušit nároky na údržbu X11. Kancelářský balík LibreOffice pracuje na podpoře jazyka Markdown. Společnost System76 představila novou

Podíváme se do našich luhů a hájů, zaměříme se na phishing parazitující na VZP, na zajímavosti z výroční zprávy BIS, na útok na systémy ministerstva vnitra či Varování NUKIBu před AI DeepSeek. https:/

Vydání LibreOffice 25.8 RC1, nová vývojová verze Wine 10.12 a EGL backend pro X11, týden v KDE o Plasmě 6.5, GNOME s nástrojem pro konverzi barev, Blender 4.5 RC1 s výrazně vylepšenou podporou API Vul

Linux 6.17 bez ovladače pro paketový zápis CD/DVD, podpora zobrazení u Intel Wildcat Lake a DG1, regrese jádra 6.16 bude v Linuxu 6.17 řešena, opravy pro Transient Scheduler Attacks v jádrech od 6.15

Na článek o výpočtech s pevnou řádovou tečkou (čárkou) dnes navážeme. Ukážeme si limity této reprezentace numerických hodnot a seznámíme se s algoritmem CORDIC, kterého lze použít pro výpočet goniomet

Pravidelná sonda do světa software. Podíváme se na nástroj pro import grafických assetů z Figmy do zdrojáku, budeme přenášet data mezi databázemi a nakonec si přesuneme playlisty např. z foobar2000 do

Ukážeme si základní vlastnosti knihovny FAISS, která je určena pro vyhledávání vektorů (s vysokými počty dimenzí) na základě jejich podobnosti. Tato knihovna se používá třeba při zpracování přirozenéh