Mocná supertechnológia

O tom, prečo je internet, najmä v spojení s umelou inteligenciou, dobrý sluha a zlý pán, sme sa rozprávali s Mariánom Šimkom z Kempelenovho inštitútu inteligentných technológií.

Čo priniesol vynález internetu?

Rozvoj internetu ako celosvetovej počítačovej siete a neskorší vznik webu na šírenie informácií sú vynálezy podobnej dôležitosti, ako bol vynález kníhtlače. Obe tieto technológie zásadným spôsobom prispeli k tomu, že poznatky a informácie máme poruke. Nemusíme zháňať knihy, dlho čakať na ich dostupnosť v knižnici či prácne v nich hľadať informácie. V súčasnosti nám stačí siahnuť do vrecka a vyťukať jednoduchý dopyt. Odbúrala sa tak obrovská bariéra v prístupe k informáciám. Okrem toho nám tieto technológie umožnili spájať sa – s priateľmi, rodinou, ale aj cudzincami. Naše sociálne siete sa stali virtuálnymi.

V posledných rokoch sa k technológiám, ktoré zásadne menia naše životy, zaradila aj umelá inteligencia. Prečo až teraz?

Je to najmä vďaka neustále rastúcej výkonnosti (výpočtovej sile) počítačov, teda ich hardvérovej stránky. Množstvo operácií, ktoré teraz dokážeme na počítači vykonávať, sa posunulo na hranicu, keď už môžeme efektívne vytvárať tzv. modely neurónových sietí predstavujúce kľúčovú zložku súčasnej umelej inteligencie (AI).
AI ešte nie je taká, akú ju vídame vo filmoch. Nemá ľudskú podobu ani vedomie a ešte nejaký čas ho mať nebude. Jej aplikácie nás však takmer dennodenne udivujú v tom, aké pokroky dokáže robiť a aké zložité problémy nám pomáha riešiť. Obzvlášť v spojení s internetom nám toho môže veľa dať, no zároveň so sebou prináša aj nebezpečenstvá. Je dôležité, aby sme nové technológie využívali s rozumom a boli si vedomí rizík, ktoré sú s nimi spojené.

Marián Šimko je expert na spracovanie prirodzeného jazyka a umelú inteligenciu. V Kempelenovom inštitúte inteligentných technológií vedie výskumný tím zaoberajúci sa spracovaním prirodzeného jazyka (NLP) a pôsobí ako zástupca riaditeľky. Aktuálne sa zaoberá výskumom a vývojom riešení spracovania prirodzeného jazyka so zameraním na veľké jazykové modely a jazyky s tzv. málo dostupnými dátami, medzi ktoré možno zaradiť aj slovenčinu, s dôrazom na reálne aplikácie v praxi.

Ako v súčasnosti charakterizujeme umelú inteligenciu?

Umelá inteligencia sú počítačové programy, ktoré vznikli tzv. trénovaním (učením). Vedia riešiť ťažké úlohy, teda spracovávať vstupy, na ktoré neboli špeciálne natrénované a ktoré predtým nevideli. Trénovanie je proces, v ktorom vytvárame počítačový program, alebo presnejšie model. No nerobíme to klasickým programovaním, teda písaním programového kódu, čo bol doteraz dominantný spôsob tvorby počítačových programov. Model je základná súčiastka umelej inteligencie. V podstate je to niečo, čo dokážeme natrénovať (naučiť). Veľmi výkonným modelom je umelá neurónová sieť inšpirovaná naším mozgom. Ten pozostáva z miliárd neurónov a biliónov prepojení medzi nimi. Túto štruktúru kopíruje aj umelá neurónová sieť s tým rozdielom, že umelé neuróny nie sú živé bunky, ale jednoduché matematické funkcie.
Umelá neurónová sieť je obrovská sieť čísel schopná zapamätať si veľmi veľa informácií a riešiť všeobecné úlohy, napríklad odpovedať na otázku Je na zobrazenom obrázku pes? alebo viesť konverzáciu s používateľom na takmer ľubovoľnú tému.

Ako funguje AI?

Životný cyklus umelej inteligencie pozostáva z dvoch základných častí – už spomínaného trénovania a prevádzky.
Trénovanie modelu AI môže prebiehať rôznymi spôsobmi. Jedným z nich je, že modelu dávame na vstup rôzne príklady úlohy, ktorej riešenie ho chceme naučiť. Zoberme si príklad: Model chceme naučiť rozpoznávať, či na obrázku je alebo nie je pes. V procese trénovania mu preto ukážeme stovky až tisíce obrázkov, na ktorých pes je. Zároveň mu ukážeme ďalšie tisíce obrázkov, kde sa nachádza nejaký iný tvor alebo objekt. Čím viac príkladov – pozitívnych aj negatívnych – máme, tým lepší model dokážeme natrénovať. Ten si v procese trénovania upravuje svoju vnútornú štruktúru – miliardy čísel, aby dokázal správne odpovedať. Presný mechanizmus učenia je daný typom (architektúrou) neurónovej siete, ktorá je na tú-ktorú úlohu určená.
Prevádzka umelej inteligencie je používanie natrénovaného modelu. V našom príklade ukážeme modelu nový obrázok, ktorý predtým ešte nevidel, a ten na základe svojej vnútornej číselnej štruktúry odvodí, či ide, alebo nejde o psa.

Na čo sa používa takto natrénovaná AI?

Umelá inteligencia pracujúca s obrázkami je veľmi užitočná v medicíne, napríklad pri detekcii ochorení na lekárskych snímkach, alebo v doprave pri detekcii objektov pre autonómne vozidlá.
Iným prípadom použitia AI je práca s textom. Vezmime si filter nevyžiadanej pošty (spam filter) v emailovej aplikácii, ktorý usilovne deteguje, či prijatá pošta pochádza od hodnoverného zdroja alebo ide o nechcený, či dokonca škodlivý obsah. Ešte lepším príkladom umelej inteligencie pracujúcej s textom sú inteligentné četboty ako v súčasnosti veľmi známy ChatGPT. Ich základom sú tzv. veľké jazykové modely.

Čo sú veľké jazykové modely?

Podobne ako pri modeloch na spracovanie obrázkov ide o modely umelých neurónových sietí. Zaujímavý je proces ich trénovania. Príklady, ktoré takémuto modelu ukazujeme, sú len vety, ich počet rátame v miliardách. Opäť platí: čím viac, tým lepšie. Modelu ich však ukazujeme postupne tak, že niektoré slová z viet schováme a trénujeme ho na to, aby vynechané slová uhádol. Model si pomocou miliárd čísel, ktoré obsahuje, zakóduje postupnosti slov tak, že ich vie generovať v zmysluplnom poradí. Z toho dôvodu potom v prevádzke do vety: Cez Bratislavu tečie… nedoplní slovo medveď alebo vysvedčenie, ale slová ako rieka alebo Dunaj. To preto, lebo tie sa oveľa viac podobajú na to, čo videl v príkladoch, z ktorých sa učil.
Fungovanie umelej inteligencie je založené na štatistike. Jej modely neponúkajú na svojom výstupe vždy zaručene správnu možnosť, ale tú najpravdepodobnejšiu.
Jeden už trochu starší, ale zato rýdzo slovenský veľký jazykový model si môžete vyskúšať na stránke slovakbert.kinit.sk.

Pokračovanie článku si môžete prečítať v časopise Quark 4/2024. Ak chcete mať prístup k exkluzívnemu obsahu pre predplatiteľov, prihláste sa. Ak ešte nie ste naším predplatiteľom, objednajte si predplatné podľa vášho výberu tu.

Za rozhovor ďakuje redakcia Quarku
Rozhovor vznikol na základe článku pre Detskú Univerzitu Komenského 2023.

Cookie	Dĺžka trvania	Popis
__wpdm_client	relácia	Technický súbor cookie, ktorý synchronizuje webovú stránku a CMS. Používa sa na aktualizáciu webovej stránky.
cookielawinfo-checkbox-advertisement	1 rok	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Reklama“.
cookielawinfo-checkbox-analytics	11 mesiacov	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Analytické“.
cookielawinfo-checkbox-necessary	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Nevyhnutné“.
CookieLawInfoConsent	1 rok	Tento súbor cookie zaznamená predvolený stav tlačidla zodpovedajúcej kategórie. Funguje iba v koordinácii s primárnym súborom cookie.
PHPSESSID	relácia	Tento súbor cookie je natívny pre aplikácie PHP. Súbor cookie sa používa na ukladanie a identifikáciu jedinečného ID relácie používateľa na účely riadenia relácie používateľa na webovej lokalite. Súbor cookie je súbor cookie relácie a vymaže sa, keď sa zatvoria všetky okná prehliadača.
viewed_cookie_policy	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookies. Neukladá žiadne osobné dáta.

Cookie	Dĺžka trvania	Popis
_ga	2 roky	Súbor cookie _ga nainštalovaný službou Google Analytics počíta údaje o návštevníkoch, reláciách a kampaniach a tiež sleduje používanie stránky pre analytický prehľad stránky. Súbor cookie ukladá informácie anonymne a priraďuje náhodne vygenerované číslo na rozpoznanie jedinečných návštevníkov.
_gat	1 minúta	Používa ho Google Analytics na zníženie počtu žiadostí.
_gid	1 deň	Súbor cookie _gid nainštalovaný službou Google Analytics ukladá informácie o tom, ako návštevníci používajú webovú stránku, a zároveň vytvára analytickú správu o výkonnosti webovej lokality. Niektoré zo zhromažďovaných údajov zahŕňajú počet návštevníkov, ich zdroj a stránky, ktoré anonymne navštevujú.
CONSENT	2 roky	YouTube nastavuje tento súbor cookie prostredníctvom vložených videí youtube a zaznamenáva anonymné štatistické údaje.

Cookie	Dĺžka trvania	Popis
fr	3 mesiace	Facebook nastavuje tento súbor cookie tak, aby používateľom zobrazoval relevantné reklamy sledovaním správania používateľov na webe, na stránkach, ktoré majú Facebook pixel alebo sociálny doplnok Facebook.
sb	2 roky	Tento súbor cookie používa Facebook na kontrolu svojich funkcií, zhromažďovanie jazykových nastavení a zdieľanie stránok.
VISITOR_INFO1_LIVE	5 mesiacov a 27 dní	Súbor cookie nastavený službou YouTube na meranie šírky pásma, ktorý určuje, či používateľ získa nové alebo staré rozhranie prehrávača.
YSC	relácia	Súbor cookie YSC nastavuje Youtube a používa sa na sledovanie zhliadnutí vložených videí cez stránku Youtube.
yt-remote-connected-devices		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.
yt-remote-device-id		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.

Možnosti

Značky

Možnosti

Značky

Mohlo by vás tiež zaujímať...

Divy v novom svetle

Test pozornosti 7/2024

Knižné tipy kníhkupectva Artforum 5

Používanie cookies