Počítač zo škatuliek

V súčasnosti počítače dokážu počítať a pracovať oveľa efektívnejšie ako ľudia, no vnútri zariadení je to naďalej iba sled elektrických signálov prenášaných miliardami tranzistorov.

Ako to počítače robia, že nás porazia v šachu, šoférujú autá, ovládajú celé výrobné haly, tvoria umelecké diela v štýle známych umelcov, riadia vesmírne lety, financie, výskum a zdanlivo už aj rozmýšľajú rýchlejšie a efektívnejšie ako my?

Miniatúrne súčiastky

Ešte nedávno sa slovom počítač nazývalo povolanie, kde zamestnanci doslova počítali. Veľké množstvo pracovníkov pri stoloch počítalo potrebné úlohy ručne. Používali na to rôzne pomôcky, napríklad mechanické počítadlo abakus. Samotné počítanie a jeho logiku však vykonávali ľudia. V priebehu desaťročí sa techniky aj prístroje zdokonaľovali. Jedným z priekopníkov bol aj britský matematik Alan Turing (1912 – 1954) a jeho dekódovací stroj Enigma. Základom fungovania moderných počítačov sa neskôr stali tranzistory, ktoré tvoria základný stavebný prvok mikroprocesorov ako integrovaných obvodov. Prvé tranzistory boli pomerne veľké, no súčasné sú také malé, že na jeden mikročip sa ich zmestí až niekoľko miliárd. Tranzistor má dva vstupy a jeden výstup pre elektrický signál. Jeden z prichádzajúcich signálov je hlavný, nazývame ho aj zdroj (angl. source, emitter), a druhý prichádzajúci signál je kontrolný, voláme ho brána (angl. gate, base). Odchádzajúci signál sa nazýva kolektor (angl. drain, collector).

Schéma fungovania tranzistora

Iba jednotky a nuly

Tranzistor vnútri počítačov je vyrobený z dvoch druhov kremíka – n-typu a p-typu. Pri zdroji a pri kolektore je vodivý n-typ, medzi nimi je nevodivý p-typ. Keď na bránu neprichádza elektrický signál, je zatvorená, na jej mieste nie je dostatok elektrónov, a tak tadiaľ nemá ako prejsť hlavný elektrický signál. Až privedením elektrického signálu na bránu sa elektróny v časti p-typu usporiadajú tak, že aj táto časť sa stane vodivá, a hlavný signál môže prechádzať ďalej. Môžeme povedať, že brána riadi hlavný signál. Keď signál na bránu prichádza, zabezpečí prechod aj hlavného signálu, túto situáciu môžeme označiť číslom 1. Keď na bránu signál neprivedieme, hlavný signál sa ďalej nedostane – zjednodušene ako 0. Tak sa dostávame k jednotkám a nulám, symbolicky zapnutým a vypnutým žiarovkám. Vnútri počítačov sa teda nedeje nič iné ako zapínanie a vypínanie správne poprepájaných miliónov tranzistorov.

Učiaci sa stroj

Hracia plocha hry hexapawn na začiatku hry

Počítače sa dokážu učiť. Učia sa na základe skúseností, ktoré vedia efektívne zužitkovať. Na rozdiel od ľudí majú počítače dokonalú pamäť. Dokážu simulovať rôzne situácie neuveriteľne rýchlo. Niekoľko tisíc zápasov v akejkoľvek hre odohrajú v priebehu minút. Nemajú emócie, neurazia sa pri prehre a neprevrátia stôl so šachovnicou. Nestratia motiváciu ani po milióntom neúspešnom pokuse. Základné princípy samoučiacich sa neurónových sietí, pomocou ktorých sa počítače rozhodujú, je možné si vyrobiť aj doma. Stačí na to dvadsaťštyri potlačených škatuliek a farebné cukríky. Hra, ktorú sa škatuľkový počítač dokáže naučiť hrať dokonale, sa nazýva hexapawn. Ako názov napovedá, bude sa hrať so šiestimi pešiakmi. Na hracej ploche 3 × 3 štvorce má každý hráč na začiatku na svojej strane troch pešiakov. Hráči sa v ťahoch striedajú. Pešiak sa môže pohybovať a vyhadzovať súperove figúrky rovnako ako v šachu – pohybom pešiaka o jedno políčko dopredu na prázdny štvorec. Vyhadzovať súperove figúrky môže iba uhlopriečne o jedno políčko. Hráč vyhrá hru, keď vyhodí všetky súperove figúrky, alebo sa jeden jeho pešiak dostane na políčko druhej strany hracej plochy. Prehráva, keď nemá možnosť žiadneho pohybu.

Škatuľky potlačené všetkými možnými ťahmi počítača. Číslo na škatuľke označuje ťah v poradí v hre.

Jednoduchá hra

Dvadsaťštyri škatuliek je potlačených všetkými možnými usporiadaniami figúrok na hracej ploche počas každého ťahu počítača. Človek ide vždy prvý a môže spraviť ľubovoľný ťah niektorou zo svojich troch figúrok. Druhý ťah patrí počítaču. Aký to bude, rozhodne vylosovanie náhodného cukríka zo správnej škatuľky. Škatuľky s číslom 2 sú však iba dve. Celá hra je osovo súmerná a ťah počítača sa rozhodne na základe rovnakej škatuľky, či už bol prvý ťah človeka ľavou alebo pravou figúrkou. Platí to aj pre všetky nasledujúce ťahy. Počítač urobí ťah podľa rovnako farebnej šípky, akú má vylosovaný cukrík. Cukrík sa vráti naspäť do škatuľky a nasleduje ťah človeka podľa jeho vlastného uváženia. Hra pokračuje, až kým jeden z hráčov nevyhrá. V prípade prehry počítača je najpodstatnejšie odstrániť vylosovaný cukrík z poslednej škatuľky použitej pre jeho ťah. To bude pre počítač znamenať, že daný ťah bol nevýherný a nebude tak možné vylosovať tento cukrík v nasledujúcich hrách, keď nastane rovnaká situácia. Naopak, keď počítač hru vyhrá, do poslednej použitej škatuľky sa pridá ešte jeden cukrík rovnakej farby, akej bol výherný ťah. To zvýši pravdepodobnosť víťazného rozhodnutia pre počítač pri všetkých ďalších rovnakých situáciách v hre. Výherca hry sa zaznačí do tabuľky, figúrky sa vrátia na štartovacie pozície a začneme novú hru použitím tých istých škatuliek.

Systém odmien a trestov

Momentka z priebehu hry. Štvrtý ťah v hre patrí počítaču. Aký to bude, to sa vylosuje z danej škatuľky.

Týmto spôsobom sa odohrá veľa hier. Vždy sa zaznačí víťaz a upraví počet cukríkov v danej škatuľke. Niekoľko prvých hier vyhrá človek úplne ľahko. Postupne sa však počítač naučí všetky možné víťazné a nevíťazné ťahy pre všetky možné priebehy hry. Približne po dvadsiatich hrách človek stratí možnosť akejkoľvek obrany a nemá šancu vyhrať. Počítač sa vyvinul a naučil sa zvíťaziť v sto percentách prípadov. Je to však naozaj učenie, keď sa iba pridávajú a odoberajú cukríky zo škatuliek? Deti sa učia podobne. Chytia sa niečoho horúceho a odoberú si v mozgu cukrík zo škatuľky dotýkania sa horúcich vecí. Dostanú pochvalu a sladkosti za dobré známky a pridajú si cukrík do škatuľky pozornosti na hodinách v škole. Náš mozog sa celý život učí a formuje svoje vlastné milióny škatuliek. Experiment so škatuľkovým počítačom je starý takmer 50 rokov. Vytvoril ho americký matematik Martin Gardner. Experiment sa dá vyskúšať stiahnutím šablóny a vytvorením vlastného škatuľkového počítača. Existuje rovnaká verzia učiaceho sa počítača pre hru štandardných piškvoriek na hracej ploche 3 × 3. Tá má až 304 škatuliek a počítač sa postupne tiež naučí hrať úplne dokonale. Dokonca je možné nechať hrať proti sebe dva počítače s dvomi samostatnými sadami škatuliek.

Americký matematik Martin Gardner, tvorca experimentu so škatuľkovým počítačom, foto wikipédia/RobertoTenore

Nepredvídateľné správanie

Škatuľkový počítač síce nerozmýšľa a necíti rovnako ako ľudia, ale určite sa veľmi podobne učí. Hra hexapawn je zjednodušeným príkladom generických algoritmov, ktoré poháňajú aj biologickú evolúciu prirodzeného výberu. Neurónové siete v počítačových algoritmoch v základoch fungujú podobným princípom. Škatuľky pre zložité procesy sú však, samozrejme, extrémne komplikovanejšie, vnorené, rôzne rozkorenené, so stovkami podmienok a nastavení. Počítač učením sa túto štruktúru mení a prispôsobuje, aby dosiahol tie najlepšie výsledky. Napríklad po dvoch miliónoch odohratých hier alebo splnených a nesplnených úloh v takejto veľmi zložitej štruktúre neurónovej siete je mimo možností človeka zistiť, ktorá štruktúra vznikla z akých dôvodov a prečo vyzerá tak, ako vyzerá. Doslova platí, že vedci nevedia, ako sa isté veci umelá inteligencia učí. Do programu sa vložia vstupné dáta, prejdú cez pre nás symbolicky čiernu skrinku a vo výsledku dostaneme dokonalý požadovaný výsledok. Toto je jeden z dôvodov, prečo sa niektorí vedci boja budúcnosti umelej inteligencie, ktorá má v porovnaní s nami nekonečné možnosti a jej evolúcia napreduje oveľa rýchlejšie ako tá naša.

Text a foto Stanislav Griguš
Fakulta matematiky, fyziky a informatiky
Univerzita Komenského v Bratislave
Videá autora nájdete na YouTube kanáli bit.ly/ToAkoPreco.
PDF so šablónami na potlačenie škatuliek si môžete stiahnuť tu.

Tento článok si môžete prečítať v časopise Quark 9/2020. Ak chcete mať prístup k exkluzívnemu obsahu pre predplatiteľov, prihláste sa. Ak ešte nie ste naším predplatiteľom, objednajte si predplatné podľa vášho výberu tu.