Organický chemik z IBM

Foto shotsstudio@Fotky&Foto

Predpovedanie produktov chemických reakcií predstavuje pomerne náročnú úlohu, s ktorou žiaci a študenti často zápasia po nociach predchádzajúcich písomkám a zápočtom.

Začiatky sú v organickej chémii náročné, študenti sa musia popasovať s názvoslovím, štruktúrou a s reakciami rôzne zložitých zlúčenín. Niet div, že mnoho študentov začne učivo memorovať – namiesto úsilia o pochopenie vzťahu medzi štruktúrou a reaktivitou sa uchýlia k naučeniu sa názvu a produktu reakcie. Svet vedy a technológie pomaly, ale isto, začína ovládať umelá inteligencia (UI), nevyhne sa jej ani štúdium organickej chémie. Vedci z IBM Research vo švajčiarskom Zürichu vyvinuli program na báze strojového učenia (machine learning), ktorý pomôže pri tréningu predpovedania priebehu organických chemických reakcií.

Théophile Gaudin a Philippe Schwaller, dvaja doktorandi stojaci za vývojom IBM RXN for Chemistry, foto IBM

UI v úložisku

Nová služba cloud, ktorú autori nazvali IBM RXN (skratka pre reaction, z angl. reakcia), pracuje na báze umelej inteligencie a dokáže predpovedať produkty reakcií z reaktantov, ktoré s a m i nakreslíte. Na projekte IBM RXN pracovala trojica vedcov niečo vyše roka. Pôvodne išlo o projekt dvoch doktorandov – Théophila Gaudina a Philippa Schwallera pod vedením Dr. Teodora Laina. Počas niekoľkých mesiacov sa pokúšali vytvoriť online platformu na báze strojového učenia, ktorá by dokázala predpovedať produkty reakcií v organickej chémii. Minulý december nám o našom projekte vyšiel vedecký článok v časopise Chemical Science. Článok bol možno príliš technický, nebol totiž adresovaný chemikom. Išlo však o prvý model na báze umelej inteligencie, ktorý je založený výlučne na dátach v podobe organických chemických reakcií, vysvetlil pre Quark vedúci projektu Dr. Laino. Reakcia na ich projekt bola obrovská a vedcov prekvapila. Rozhodli sa preto pokračovať a službu poskytnúť verejnosti zadarmo. Chvíľu nám to trvalo, keďže sme narazili na zopár problémov so softvérom, no napokon sme to zvládli, opisuje priebeh Ph. Schwaller. Výsledná webová služba je dostupná od augusta, časopisu Quark ju predstavili ako prvým na svete ešte pred oficiálnym sprevádzkovaním a pred predstavením na prestížnej konferencii Americkej chemickej spoločnosti v Bostone. Aj napriek tomu, že IBM RXN nepracuje so žiadnymi pravidlami platnými v organickej chémii, ani na báze molekulového modelovania, dokáže predpovedať správny produkt v 80 % prípadov. V porovnaní s programom pracujúcim s modelovaním elektrónovej hustoty, ktorý dokáže uskutočniť jedno meranie v rádovo desiatkach tisícov sekúnd, IBM RXN dodá výsledok za menej ako jednu sekundu.

Ako cudzí jazyk

Program na báze umelej inteligencie vedci navrhli podobne, ako funguje umelá neurónová sieť Google na preklad jazykov. Štúdium organickej chémie je veľmi podobné učeniu sa cudzieho jazyka. Keďže organická chémia obsahuje veľa univerzálnych pravidiel, skúsili sme ich spracovať podobne ako gramatické pravidlá v cudzích jazykoch, ako sú napríklad angličtina, nemčina či francúzština. Náš systém sa vlastne učí na týchto pravidlách a je tým lepší, čím viac príkladov dostane k dispozícii, vysvetľujú autori. Pôvodný zámer vedcov bolo poskytnúť túto online službu na predpovedanie a precvičovanie si reakcií v organickej chémii širokej verejnosti. Vzhľadom na to, že väčšina známych databáz na vyhľadávanie reakcií ako Reaxys či SciFinder pracujú s paywallom (kto si zaplatí, ten sa k obsahu dostane), Lainov tím musel nájsť inú možnosť.

Tento článok si môžete prečítať v časopise Quark 10/2018.

Ak chcete mať prístup aj k exkluzívnemu obsahu pre predplatiteľov alebo si objednať tlačenú verziu časopisu Quark, prihláste sa alebo zaregistrujte.

Podľa Chemical Science a IBM RXN for Chemistry
spracovala Dr. Martina Ribar Hestericová
Lonza Group, Bazilej