Chip 10/2024: V nedávné době se veřejnost seznámila s desítkami velkých jazykových modelů (Language Large Models, LLM) trénovaných na obrovských datasetech, které dokážou číst, shrnovat a generovat text. Wikipedie je jedním z největších otevřených korpusů informací na internetu, s obsahem ve více než 300 jazykových verzích. Dosud byl každý velký jazykový model trénován na obsahu Wikipedie a téměř vždy tento obsah představoval největší zdroj tréninkových dat.
Modely generativní umělé inteligence typu ChatGPT potřebují pro svou funkci spoustu levných a bezplatných obsahů a využívají tak miliony článků na Wikipedii jako významný zdroj. Během 23 let své existence se Wikipedie stala jedním z důvěryhodných informačních zdrojů. Avšak texty a obrazy generované umělou inteligencí se na internetu rozšiřují rychlým tempem, a proto se musí vývojáři vypořádat s otázkou, která je pro Wikipedii existenční: jak její open source étos přežije nastávající mohutný datový obsahový proud?
Pojďte se s námi podívat podrobněji na to, jaké výhody může Wikipedie nabídnout svým uživatelům i v době nástupu umělé inteligence. O co je důvěryhodnější a kde ji naopak AI poráží. A zkusme také odhadnout její budoucnost. Vše se dozvíte v říjnovém Chipu, který je v prodeji od 18.9.