Fakulta informačních technologií ČVUT v Praze (FIT ČVUT) oslaví v červnu už 10 let své existence. Učí se zde zhruba 2500 studentů a na fakultě působí 16 laboratoří. Jednou z nich je nově Laboratoř otevřených dat (OpenDataLab), která vznikla ve spolupráci s firmou Profinit EU. Studenti si zde mohou vyzkoušet zajímavou práci s otevřenými zdroji dat. Naskýtá se jim příležitost zpracovávat data o dopravní obslužnosti, hospodaření státu, životním prostředí a mnoha dalších oblastech.
Laboratoř se bude zabývat především zpracováním dostupných dat, kterých je velké množství, ale jejich využití pokulhává. V laboratoři budou vznikat nad těmito daty nové aplikace, analýzy a závěry usnadňující každodenní život. Zpracování těchto dat je zároveň příležitostí, jak ušetřit nebo zefektivnit stávající procesy a zlepšit život obyvatel.
Laboratoř se zpočátku zaměří na dva hlavní zdroje: data o hospodaření státu a dopravní informace o poloze příměstských dopravních spojů. Výzkum v oblasti efektivního vyhledávání otevřených a propojených dat a jejich správy pomůže lépe řešit praktické úkoly, například v oblasti datové žurnalistiky. Zároveň se tím vytváří poptávka po otevírání a propojování dalších zajímavých datových zdrojů veřejné správy.
V laboratoři budou řešeny také úlohy na zpracování textu, protože například v registru smluv je k dispozici velké množství strojově čitelných dokumentů. Je tak možné řešit kategorizaci dokumentů, hledat adresy, kontaktní údaje a společné části v dokumentech v rozsahu srovnatelném s komerčními aplikacemi.
Hospodaření státu
A jak je na tom vůbec v otázce přístupnosti dat stát? Například faktury pravidelně zveřejňuje 7 z celkově 14 ministerstev. OpenDataLab se zeptal těch zbylých na seznam pohledávek a faktury za posledních 5 let. Ministerstva vnitra, zahraničí, školství a zemědělství data dodala. Ministerstvo průmyslu žádost vyřizuje. Například Ministerstvo práce a sociálních věcí vyčíslilo požadavek OpenDataLabu na 17 390 Kč a 76 hodin práce a Policejní prezidium dokonce na 15 893 822 Kč. Jak je vidět, každé ministerstvo je tak trochu státem samo o sobě.
Už nyní fungují betaverze datasetů na serveru Hlídač státu. Podívat se na něj můžete na www.hlidacstatu.cz/data?beta=1. Projekt páruje smlouvy a vydané faktury – každý tak snadno zjistí, jak moc se dodržují smluvní ceny.
Platforma Golemio
Také pražské platforma otevřených dat Golemio nabízí už dnes řadu zajímavých možností na využítí. OpenDataLab si zatím vybral informace o poloze příměstských spojů. Jde o snahu předvídat zpoždění linek, možnost detekování neočekávaných stání autobusů či vybočení z trasy a tím zajistit všem cestujícím větší pohodlí. Cílem je vytvořit aplikaci s vizualizací, jaká již funguje například v Brně nebo Jihlavě.
OpenDataLabu držíme palce v jejich práci a při vyvíjení tlaku na zpřístupnění a prezentaci všech možných otevřených dat. Na studenty tu čekají atraktivní projekty: od dolování dat z webu státních institucí a jejich následné katalogizace, přes analyzování útrát státních úřadů, až po hledání souvislosti mezi přítomností poslanců v PS ČR a počasím. Více informací na https://fit.cvut.cz/opendatalab.