Medzi najlepšími na svete

Dôležitými atribútmi uplatnenia systémov umelej inteligencie v praxi sú ich správne fungovanie a bezpečnosť. Aj preto bola v roku 2020 vypísaná prvá súťaž na certifikáciu neurónových sietí. Víťazom súťaže sa stali výskumníci zo Švajčiarskeho federálneho inštitútu technológií, teraz už zakladatelia spoločnosti LatticeFlow z Zürichu. Jej technickým riaditeľom je Pavol Bielik z Bratislavy.

Na Európskom rádiologickom kongrese prezentoval P. Bielik v júli tohto roku metódu, ktorá umožňuje lekárom pomocou strojového učenia stanoviť presnú diagnózu choroby z röntgenových snímok, a tiež spôsob, ako jeho firma dokáže analyzovať, či strojové učenie funguje správne. Firma LatticeFlow patrí v tejto oblasti medzi najlepšie na svete.

Cesta za strojovým učením

Prvé kurzy strojového učenia absolvoval P. Bielik na Slovenskej technickej univerzite (STU) v Bratislave. Po ukončení bakalárskeho štúdia v Bratislave sa prihlásil na magisterské štúdium informatiky na Švajčiarskom federálnom inštitúte technológií v Zürichu (Eidgenössische Technische Hochschule Zürich, ETH), jednu z desiatich najlepších univerzít na svete. Po prijatí na ETH – bez skúšok, len na základe posúdenia jeho študijných výsledkov a vedeckých prác – sa presťahoval do Zürichu. Tam ho zaujala práca profesora Martina Vecheva z Laboratória bezpečných, spoľahlivých a inteligentných systémov. V rámci tohto laboratória neskôr absolvoval aj doktorandské štúdium.

Pavol Bielik prezentuje svoje projekty v Menlo Parku v sídle spoločnosti Meta (predtým Facebook), foto archív Pavla Bielika.

Šesť rokov, ktoré nasledovali po jeho prijatí na ETH, bolo obdobím tvrdej práce. Riešil množstvo náročných projektov na rozhraní strojového učenia a formálnej analýzy počítačových programov, teda analýzy, či programy fungujú správne. Jeho túžba riešiť veľmi zložité technické problémy, ktoré majú praktické využitie, čoskoro viedla k viacerým publikáciám na špičkových vedeckých konferenciách. Za svoju prácu bol v roku 2016 vybraný na prestížne Heidelberské fórum laureátov a získal Rombergov grant. V roku 2017 bol navyše jediným študentom z Európy, ktorý získal veľmi konkurenčné štipendium Facebook PhD Fellowship (v súčasnosti Meta Research PhD Fellowship).
Vďaka náročnému štúdiu na ETH, mentoringu študentov a prezentácii svojich prác na medzinárodných konferenciách P. Bielik pochopil, že popri kvalitnej výskumnej práci je rovnako dôležitá aj prezentácia výsledkov práce odborníkom a verejnosti.

Vľavo: Röntgen hrudníka, kde strojové učenie zdanlivo dosiahlo nadľudské výsledky – šípky označujú patológiu identifikovanú lekárom. Vpravo: Na základe dôkladnej analýzy sa ukázalo, že ten istý algoritmus je v skutočnosti horší ako lekár, pretože sa nesprávne naučil rozoznávať liečbu pacienta namiesto skutočného ochorenia. Zdroj doi: 10.1145/3368555.3384468

Analýzy programov

Keď P. Bielik študoval na STU a neskôr na ETH, hlavnou oblasťou jeho štúdia boli analýzy a overovanie programov. Každý program, či už na vytvorenie webstránky alebo riadenie letu vesmírnej rakety, má zadefinované, čo by mal robiť.
Napríklad program, ktorý má triediť vstupný zoznam čísel, má zadefinovanú takúto špecifikáciu: výsledok musí obsahovať tie isté čísla, ktoré boli aj na vstupe (ani viac, ani menej), každé číslo vo výsledku musí byť väčšie alebo rovnaké ako predošlé číslo.
Overovanie programov sa pozrie na špecifikáciu, ako aj na samotný program očami matematiky s tým, že špecifikácia sa preloží do matematickej formuly s cieľom dokázať, že tento program naozaj vypočíta požadovaný výsledok pre akýkoľvek možný vstup. Samotný dôkaz je pre reálne programy zložitý, pretože tie sú oveľa komplikovanejšie ako náš príklad s triedením čísel a tiež preto, že možných vstupov do programov je často nekonečne veľa.
Takéto programy zaujímali P. Bielika z dvoch dôvodov. Bolo v nich veľa matematiky, ktorú si obľúbil už na matematickom gymnáziu v Bratislave známom pod názvom Gamča, a súčasne riešili praktické úlohy zo života.

Prečo neurónové siete?

Plastika Alana Turinga od Stephena Kettlea, foto wikipédia Jon Callas, CC BY 2.0

Napriek tomu, že P. Bielik (aj celá výskumná skupina, ktorej bol členom) začínal s analýzou programov, v súčasnosti už vyvíja aplikácie pre strojové učenie. V konečnom dôsledku je neurónová sieť, ktorá realizuje strojové učenie, tiež iba program. Aplikácie pre strojové učenie riešia univerzity, výskumné inštitúty a aj firmy po celom svete.
Prečo sa všetci začali orientovať na strojové učenie? Stačí sa pozrieť na to, kto dostal Turingovu cenu v roku 2018 – najprestížnejšiu cenu, ktorá sa označuje ako Nobelova cena v informatike (v čase, keď vznikla Nobelova cena, informatika ešte neexistovala). Boli to traja informatici, Yoshua Bengio, Geoffrey Hinton a Yann LeCun, ktorí získali ocenenie za prelomové poznatky v hlbokom učení (deep learning).
Napríklad G. Hinton publikoval dva významné články práve v čase bakalárskeho a magisterského štúdia P. Bielika (roky 2009 až 2012). Tieto články riešili dve rôzne témy – rozpoznávanie reči a klasifikáciu obrázkov. Význam článkov nebol v tom, že by vylepšili výsledky existujúcich systémov, ale v tom, že prezentovali diametrálne odlišný spôsob, akým prišli k výsledkom. Namiesto tradičných metód na rozpoznávanie jazyka založených na expertných pravidlách a lingvistickej analýze prezentovali tieto články taký istý výsledok iba tým, že poskytli veľmi veľa dát neurónovým sieťam, ktoré sa naučili rozpoznávať reč či klasifikovať obrázky. Odvtedy sú neurónové siete za väčšinou inovatívnych riešení v oblasti umelej inteligencie.

Horná časť: Dva obrázky toho istého znamienka, vľavo (A) neoznačené lekárom, vpravo (B) označené lekárom v rámci vyšetrenia. Spodná časť: Vizualizácia časti obrázka, ktorej strojové učenie prikladá väčšiu váhu. Vľavo (C) algoritmus správne používa oblasť, kde je znamienko, vpravo (D) algoritmus nesprávne používa označenie lekára namiesto znamienka. Zdroj doi: 10.1001/jamadermatol.2019.1735

Hľadanie a oprava chýb

Hlavný problém, ktorý rieši skupina vedcov a inžinierov v LatticeFlow, je robustnosť a bezpečnosť systémov založených na strojovom učení. V praxi to znamená, že vyvinuli softvér ktorý sa usiluje porozumieť tomu, čo sa neurónová sieť naučí, s cieľom zabrániť chybám pri spracovaní nových dát – aby sa napríklad pacientovi neurčila diagnóza z nesprávnej interpretácie pri rozpoznávaní obrazu na röntgenovej snímke.
Ďalšou úlohou softvéru je hľadanie a oprava chýb v dátach. Keďže neurónové siete sú založené na učení sa z veľkého množstva dát, je nesmierne dôležité, aby tieto dáta boli správne a taktiež férové. Konkrétny príklad: Analýzou modelov na detekciu, či je spolujazdec pripútaný alebo nie, vieme zistiť, že konkrétny model funguje systematicky lepšie pre ľudí s dlhými vlasmi. A to aj napriek tomu, že dĺžka vlasov by nemala žiadnym spôsobom ovplyvňovať výsledok. Dobrá správa z tohto zistenia je, že ak vieme takéto chyby včas rozpoznať, tak ich vieme aj opraviť.

Podpora renomovaných firiem

Po ukončení doktorandského štúdia P. Bielik spolu s kolegom z Laboratória bezpečných, spoľahlivých a inteligentných systémov na ETH Petarom Tsankovom a dvoma profesormi z ETH Martinom Vechevom a Andreasom Krausem založili startup LatticeFlow. Ich víziu pomôcť firmám pri poskytovaní robustných a spoľahlivých modelov umelej inteligencie podporili investori zo spoločností rizikového kapitálu z btov Partners (BrainsToVentures) a GFC (Global Founders Capital) a prijali ju aj spoločnosti Siemens, Švajčiarske federálne železnice (SBB) a Airbus.
LatticeFlow má kanceláriu v Zürichu, hneď oproti fakulte informatiky ETH. Činnosť firmy sa rýchlo rozšírila aj do Sofie v Bulharsku. Vzhľadom na narastajúci počet nadšených zamestnancov, ktorí do nej prichádzajú z celého sveta, ako napríklad z Argentíny, Belgicka, Číny, Indie, Holandska, Slovinska či Švajčiarska, momentálne hľadá v Zürichu väčšiu kanceláriu. A v budúcnosti možno otvorí pobočku aj v Bratislave.

Vladimír Ješko

Tento článok si môžete prečítať v časopise Quark 10/2022. Ak ešte nie ste našou predplatiteľkou/naším predplatiteľom a chcete mať prístup k exkluzívnemu obsahu, objednajte si predplatné podľa vášho výberu tu.

Cookie	Dĺžka trvania	Popis
__wpdm_client	relácia	Technický súbor cookie, ktorý synchronizuje webovú stránku a CMS. Používa sa na aktualizáciu webovej stránky.
cookielawinfo-checkbox-advertisement	1 rok	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Reklama“.
cookielawinfo-checkbox-analytics	11 mesiacov	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Analytické“.
cookielawinfo-checkbox-necessary	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Nevyhnutné“.
CookieLawInfoConsent	1 rok	Tento súbor cookie zaznamená predvolený stav tlačidla zodpovedajúcej kategórie. Funguje iba v koordinácii s primárnym súborom cookie.
PHPSESSID	relácia	Tento súbor cookie je natívny pre aplikácie PHP. Súbor cookie sa používa na ukladanie a identifikáciu jedinečného ID relácie používateľa na účely riadenia relácie používateľa na webovej lokalite. Súbor cookie je súbor cookie relácie a vymaže sa, keď sa zatvoria všetky okná prehliadača.
viewed_cookie_policy	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookies. Neukladá žiadne osobné dáta.

Cookie	Dĺžka trvania	Popis
_ga	2 roky	Súbor cookie _ga nainštalovaný službou Google Analytics počíta údaje o návštevníkoch, reláciách a kampaniach a tiež sleduje používanie stránky pre analytický prehľad stránky. Súbor cookie ukladá informácie anonymne a priraďuje náhodne vygenerované číslo na rozpoznanie jedinečných návštevníkov.
_gat	1 minúta	Používa ho Google Analytics na zníženie počtu žiadostí.
_gid	1 deň	Súbor cookie _gid nainštalovaný službou Google Analytics ukladá informácie o tom, ako návštevníci používajú webovú stránku, a zároveň vytvára analytickú správu o výkonnosti webovej lokality. Niektoré zo zhromažďovaných údajov zahŕňajú počet návštevníkov, ich zdroj a stránky, ktoré anonymne navštevujú.
CONSENT	2 roky	YouTube nastavuje tento súbor cookie prostredníctvom vložených videí youtube a zaznamenáva anonymné štatistické údaje.

Cookie	Dĺžka trvania	Popis
fr	3 mesiace	Facebook nastavuje tento súbor cookie tak, aby používateľom zobrazoval relevantné reklamy sledovaním správania používateľov na webe, na stránkach, ktoré majú Facebook pixel alebo sociálny doplnok Facebook.
sb	2 roky	Tento súbor cookie používa Facebook na kontrolu svojich funkcií, zhromažďovanie jazykových nastavení a zdieľanie stránok.
VISITOR_INFO1_LIVE	5 mesiacov a 27 dní	Súbor cookie nastavený službou YouTube na meranie šírky pásma, ktorý určuje, či používateľ získa nové alebo staré rozhranie prehrávača.
YSC	relácia	Súbor cookie YSC nastavuje Youtube a používa sa na sledovanie zhliadnutí vložených videí cez stránku Youtube.
yt-remote-connected-devices		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.
yt-remote-device-id		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.

Značky

Používanie cookies