Medzi najlepšími na svete

Dôležitými atribútmi uplatnenia systémov umelej inteligencie v praxi sú ich správne fungovanie a bezpečnosť. Aj preto bola v roku 2020 vypísaná prvá súťaž na certifikáciu neurónových sietí. Víťazom súťaže sa stali výskumníci zo Švajčiarskeho federálneho inštitútu technológií, teraz už zakladatelia spoločnosti LatticeFlow z Zürichu. Jej technickým riaditeľom je Pavol Bielik z Bratislavy.

Foto Unsplash/Su San Lee

Na Európskom rádiologickom kongrese prezentoval P. Bielik v júli tohto roku metódu, ktorá umožňuje lekárom pomocou strojového učenia stanoviť presnú diagnózu choroby z röntgenových snímok, a tiež spôsob, ako jeho firma dokáže analyzovať, či strojové učenie funguje správne. Firma LatticeFlow patrí v tejto oblasti medzi najlepšie na svete.

Cesta za strojovým učením

Prvé kurzy strojového učenia absolvoval P. Bielik na Slovenskej technickej univerzite (STU) v Bratislave. Po ukončení bakalárskeho štúdia v Bratislave sa prihlásil na magisterské štúdium informatiky na Švajčiarskom federálnom inštitúte technológií v Zürichu (Eidgenössische Technische Hochschule Zürich, ETH), jednu z desiatich najlepších univerzít na svete. Po prijatí na ETH – bez skúšok, len na základe posúdenia jeho študijných výsledkov a vedeckých prác – sa presťahoval do Zürichu. Tam ho zaujala práca profesora Martina Vecheva z Laboratória bezpečných, spoľahlivých a inteligentných systémov. V rámci tohto laboratória neskôr absolvoval aj doktorandské štúdium.

Pavol Bielik prezentuje svoje projekty v Menlo Parku v sídle spoločnosti Meta (predtým Facebook), foto archív Pavla Bielika.

Šesť rokov, ktoré nasledovali po jeho prijatí na ETH, bolo obdobím tvrdej práce. Riešil množstvo náročných projektov na rozhraní strojového učenia a formálnej analýzy počítačových programov, teda analýzy, či programy fungujú správne. Jeho túžba riešiť veľmi zložité technické problémy, ktoré majú praktické využitie, čoskoro viedla k viacerým publikáciám na špičkových vedeckých konferenciách. Za svoju prácu bol v roku 2016 vybraný na prestížne Heidelberské fórum laureátov a získal Rombergov grant. V roku 2017 bol navyše jediným študentom z Európy, ktorý získal veľmi konkurenčné štipendium Facebook PhD Fellowship (v súčasnosti Meta Research PhD Fellowship).
Vďaka náročnému štúdiu na ETH, mentoringu študentov a prezentácii svojich prác na medzinárodných konferenciách P. Bielik pochopil, že popri kvalitnej výskumnej práci je rovnako dôležitá aj prezentácia výsledkov práce odborníkom a verejnosti.

Vľavo: Röntgen hrudníka, kde strojové učenie zdanlivo dosiahlo nadľudské výsledky – šípky označujú patológiu identifikovanú lekárom. Vpravo: Na základe dôkladnej analýzy sa ukázalo, že ten istý algoritmus je v skutočnosti horší ako lekár, pretože sa nesprávne naučil rozoznávať liečbu pacienta namiesto skutočného ochorenia. Zdroj doi: 10.1145/3368555.3384468

Analýzy programov

Keď P. Bielik študoval na STU a neskôr na ETH, hlavnou oblasťou jeho štúdia boli analýzy a overovanie programov. Každý program, či už na vytvorenie webstránky alebo riadenie letu vesmírnej rakety, má zadefinované, čo by mal robiť.
Napríklad program, ktorý má triediť vstupný zoznam čísel, má zadefinovanú takúto špecifikáciu: výsledok musí obsahovať tie isté čísla, ktoré boli aj na vstupe (ani viac, ani menej), každé číslo vo výsledku musí byť väčšie alebo rovnaké ako predošlé číslo.
Overovanie programov sa pozrie na špecifikáciu, ako aj na samotný program očami matematiky s tým, že špecifikácia sa preloží do matematickej formuly s cieľom dokázať, že tento program naozaj vypočíta požadovaný výsledok pre akýkoľvek možný vstup. Samotný dôkaz je pre reálne programy zložitý, pretože tie sú oveľa komplikovanejšie ako náš príklad s triedením čísel a tiež preto, že možných vstupov do programov je často nekonečne veľa.
Takéto programy zaujímali P. Bielika z dvoch dôvodov. Bolo v nich veľa matematiky, ktorú si obľúbil už na matematickom gymnáziu v Bratislave známom pod názvom Gamča, a súčasne riešili praktické úlohy zo života.

Prečo neurónové siete?

Plastika Alana Turinga od Stephena Kettlea, foto wikipédia Jon Callas, CC BY 2.0

Napriek tomu, že P. Bielik (aj celá výskumná skupina, ktorej bol členom) začínal s analýzou programov, v súčasnosti už vyvíja aplikácie pre strojové učenie. V konečnom dôsledku je neurónová sieť, ktorá realizuje strojové učenie, tiež iba program. Aplikácie pre strojové učenie riešia univerzity, výskumné inštitúty a aj firmy po celom svete.
Prečo sa všetci začali orientovať na strojové učenie? Stačí sa pozrieť na to, kto dostal Turingovu cenu v roku 2018 – najprestížnejšiu cenu, ktorá sa označuje ako Nobelova cena v informatike (v čase, keď vznikla Nobelova cena, informatika ešte neexistovala). Boli to traja informatici, Yoshua Bengio, Geoffrey Hinton a Yann LeCun, ktorí získali ocenenie za prelomové poznatky v hlbokom učení (deep learning).
Napríklad G. Hinton publikoval dva významné články práve v čase bakalárskeho a magisterského štúdia P. Bielika (roky 2009 až 2012). Tieto články riešili dve rôzne témy – rozpoznávanie reči a klasifikáciu obrázkov. Význam článkov nebol v tom, že by vylepšili výsledky existujúcich systémov, ale v tom, že prezentovali diametrálne odlišný spôsob, akým prišli k výsledkom. Namiesto tradičných metód na rozpoznávanie jazyka založených na expertných pravidlách a lingvistickej analýze prezentovali tieto články taký istý výsledok iba tým, že poskytli veľmi veľa dát neurónovým sieťam, ktoré sa naučili rozpoznávať reč či klasifikovať obrázky. Odvtedy sú neurónové siete za väčšinou inovatívnych riešení v oblasti umelej inteligencie.

Horná časť: Dva obrázky toho istého znamienka, vľavo (A) neoznačené lekárom, vpravo (B) označené lekárom v rámci vyšetrenia. Spodná časť: Vizualizácia časti obrázka, ktorej strojové učenie prikladá väčšiu váhu. Vľavo (C) algoritmus správne používa oblasť, kde je znamienko, vpravo (D) algoritmus nesprávne používa označenie lekára namiesto znamienka. Zdroj doi: 10.1001/jamadermatol.2019.1735

Hľadanie a oprava chýb

Hlavný problém, ktorý rieši skupina vedcov a inžinierov v LatticeFlow, je robustnosť a bezpečnosť systémov založených na strojovom učení. V praxi to znamená, že vyvinuli softvér ktorý sa usiluje porozumieť tomu, čo sa neurónová sieť naučí, s cieľom zabrániť chybám pri spracovaní nových dát – aby sa napríklad pacientovi neurčila diagnóza z nesprávnej interpretácie pri rozpoznávaní obrazu na röntgenovej snímke.
Ďalšou úlohou softvéru je hľadanie a oprava chýb v dátach. Keďže neurónové siete sú založené na učení sa z veľkého množstva dát, je nesmierne dôležité, aby tieto dáta boli správne a taktiež férové. Konkrétny príklad: Analýzou modelov na detekciu, či je spolujazdec pripútaný alebo nie, vieme zistiť, že konkrétny model funguje systematicky lepšie pre ľudí s dlhými vlasmi. A to aj napriek tomu, že dĺžka vlasov by nemala žiadnym spôsobom ovplyvňovať výsledok. Dobrá správa z tohto zistenia je, že ak vieme takéto chyby včas rozpoznať, tak ich vieme aj opraviť.

Podpora renomovaných firiem

Po ukončení doktorandského štúdia P. Bielik spolu s kolegom z Laboratória bezpečných, spoľahlivých a inteligentných systémov na ETH Petarom Tsankovom a dvoma profesormi z ETH Martinom Vechevom a Andreasom Krausem založili startup LatticeFlow. Ich víziu pomôcť firmám pri poskytovaní robustných a spoľahlivých modelov umelej inteligencie podporili investori zo spoločností rizikového kapitálu z btov Partners (BrainsToVentures) a GFC (Global Founders Capital) a prijali ju aj spoločnosti Siemens, Švajčiarske federálne železnice (SBB) a Airbus.
LatticeFlow má kanceláriu v Zürichu, hneď oproti fakulte informatiky ETH. Činnosť firmy sa rýchlo rozšírila aj do Sofie v Bulharsku. Vzhľadom na narastajúci počet nadšených zamestnancov, ktorí do nej prichádzajú z celého sveta, ako napríklad z Argentíny, Belgicka, Číny, Indie, Holandska, Slovinska či Švajčiarska, momentálne hľadá v Zürichu väčšiu kanceláriu. A v budúcnosti možno otvorí pobočku aj v Bratislave.

Vladimír Ješko

Tento článok si môžete prečítať v časopise Quark 10/2022. Ak ešte nie ste našou predplatiteľkou/naším predplatiteľom a chcete mať prístup k exkluzívnemu obsahu, objednajte si predplatné podľa vášho výberu tu.