Súčasný výskum ochorení pracuje s čoraz väčším množstvom biologických a medicínskych údajov. Ich analýza pomáha lepšie porozumieť tomu, čo sa pri ochoreniach deje v ľudskom tele, a zároveň umožňuje odhadovať riziko ich vzniku, čo je dôležité pre včasnú diagnostiku. Výskum sa však netýka len chorôb – skúmať možno napríklad aj to, ako genetické rozdiely súvisia s ľudskou výškou. Na vývoji efektívnych počítačových programov pre takýto výskum pracuje tím na Institute of Science and Technology Austria (ISTA).
DNA je veľmi dlhá molekula, ktorá kóduje genetickú informáciu. V roku 2003 sa podarilo po prvýkrát sekvenovať väčšinu ľudského genómu vďaka projektu Human Genome Project, ktorý trval 13 rokov a stál približne 3 miliardy dolárov. Sekvenovanie je už pomerne bežné a stojí rádovo stovky eur. K dispozícii preto máme rozsiahle databázy DNA sekvencií umožňujúce skúmať genetickú variabilitu, pričom rozdiely v jednotlivých miestach DNA medzi ľuďmi označujeme ako genetické varianty.

Jakub Bajzík navštevoval Strednú priemyselnú školu v Dubnici nad Váhom, kde sa venoval najmä elektronike a robotike. Neskôr vyštudoval zvukové inžinierstvo na Vysokom učení technickom v Brne, kde sa v posledných rokoch najviac zaujímal o programovanie, umelú inteligenciu a vedu ako takú. V doktorandskom štúdiu pokračoval na Žilinskej univerzite a venoval sa najmä výskumu umelej inteligencie a spracovaniu obrazu a zvuku.
Od roku 2022 sa čoraz intenzívnejšie začal zaujímať o to, ako porozumieť a interpretovať modely strojového učenia. Práve tento aspekt je dôležitý pri aplikáciách v biológii a pracuje s ním aj počas postdoktorandského pôsobenia na Institute of Science and Technology Austria, kde sa skúmajú výpočtové metódy, ktoré pomáhajú odhaľovať biologické pozadie komplexných ochorení a ľudských vlastností.
Od DNA k odhadu zdravotného rizika
Gény sú časti DNA a mnohé obsahujú informáciu pre tvorbu proteínov. Tie riadia bunkové procesy a následne formujú fungovanie organizmu, čo vedie k pozorovateľným fyzickým vlastnostiam (fenotyp). Čo však rozhoduje o tom, kedy a či sa určitá časť DNA aktivuje?
Vtedy vstupuje do hry epigenetika – súbor mechanizmov, ktoré ovplyvňujú aktivitu génov bez toho, aby menili samotnú sekvenciu DNA. Tieto procesy môžu ovplyvňovať rôzne faktory, napríklad strava. Zatiaľ čo sekvencia DNA zostáva počas života vo väčšine buniek takmer nezmenená, epigenetické znaky a proteóm sa môžu meniť v závislosti od aktuálneho stavu organizmu.

Moderné biotechnológie nám umožňujú zachytiť tieto zmeny meraním biologických ukazovateľov zo vzoriek krvi. Z medicínskeho hľadiska môžu tieto údaje odrážať zdravotný stav jednotlivca, preto predstavujú cenný nástroj pri skúmaní mechanizmov ochorení. V rámci výskumu sa okrem iného podieľam aj na vývoji programov, ktoré dokážu z epigenetických a proteomických údajov odhadnúť riziko vzniku ochorenia.
Čo hovoria biologické údaje
Ak teda dokážeme pozorovať rozdiely biologických ukazovateľov tisícok ľudí, prirodzene vyvstáva otázka: ako táto variabilita súvisí s variabilitou fyzických vlastností a s komplexnými ochoreniami? Cieľom je vytvoriť štatistický model, ktorý umožňuje dve dôležité veci. Po prvé, identifikovať, ktoré biologické ukazovatele štatisticky súvisia s danou vlastnosťou alebo ochorením, čo sa v prípade analýzy DNA často zobrazuje na tzv. grafe Manhattan. Ide o dôležitú informáciu napríklad pre vývoj terapií, keď dokážeme na základe štatistiky pomôcť zamerať ďalší výskum na najsľubnejšie ciele, keďže klinické testy sú veľmi drahé. Druhým dôležitým aspektom modelu je predikcia – teda možnosť odhadnúť riziko určitých ochorení ešte predtým, než sa prejavia symptómy, čo môže umožniť efektívnejšiu prevenciu a liečbu.

Od údajov k modelu
Vytvorenie modelu na základe veľkého množstva biologických údajov sa v ére superpočítačov a umelej inteligencie môže zdať jednoduché, no v skutočnosti existuje celý rad výzev. Jednou z nich je veľmi dôležitá interpretovateľnosť modelu, aby sme napríklad vedeli identifikovať gény, ktoré sú štatisticky spojené s priebehom ochorenia, čo však nemusí znamenať, že sú jeho priamou príčinou. Taktiež je potrebné mať na pamäti, že pracujeme so štatistickou vzorkou, ktorá môže byť skreslená v prospech niektorých častí populácie. V prípade, že skúmame zriedkavé ochorenia, nemusíme mať dostatok informácií na vytvorenie presného štatistického modelu. Navyše ľudská výška, ale aj mnohé ochorenia, ako sú obezita, vysoký cholesterol či infarkt, sú komplexné, pretože k nim neprispieva len jeden gén, ale súhra rôznych faktorov. Ukazuje sa, že niektoré gény alebo varianty fungujú spolu v rovnakých biologických procesoch, a preto je potrebné testovať ich kombinácie spoločne, čo zvyšuje výpočtovú aj pamäťovú náročnosť počítača.

Každá z týchto výzev má odlišný charakter – niektoré patria do oblasti štatistiky, iné do informatiky, pričom vo všetkých prípadoch je nevyhnutný biologický pohľad. Jadro našej práce v rámci tímu spočíva v prepájaní najnovších poznatkov z týchto oblastí s cieľom riešiť uvedené výzvy a prispievať k lepšiemu pochopeniu biologického pozadia komplexných ľudských ochorení a vlastností.
Čo prezrádza DNA o ľudskej výške?
V jednom z projektov, na ktorom som spolupracoval, sme sa zamerali na ľudskú výšku ako výrazne dedičnú vlastnosť, ktorá sa často používa ako modelová vlastnosť v mnohých štúdiách. Zatiaľ čo predchádzajúce štúdie sa zvyčajne zameriavali na DNA varianty, ktoré sa v populácii vyskytujú často, v tejto štúdii sme analyzovali aj veľmi zriedkavé varianty – niekedy také vzácne, že iba 1 z 10000 ľudí nesie daný variant.

S novovyvinutou výpočtovou metódou sme vykonali jednu z najrozsiahlejších genetických štúdií ľudskej výšky a dosiahli najvyššiu presnosť jej odhadu z DNA. Táto metodológia sa dá aplikovať aj na štúdium ochorení, ako sú obezita, vysoký cholesterol či infarkt, a môže tak prispieť k lepšiemu pochopeniu genetiky komplexných ochorení.
Čo ďalej?
ISTA mi poskytuje veľmi dobré podmienky na výskum na rozhraní informatiky a biológie, ktorému sa plánujem venovať aj v budúcnosti. Mojím cieľom je získať postdoktorandské štipendium a ďalej si rozširovať skúsenosti na niektorom zo zahraničných výskumných inštitútov alebo univerzít. Som presvedčený, že bioinformatika môže priniesť množstvo úžasných objavov, z ktorých môže naša spoločnosť benefitovať, ak dokážeme zároveň riešiť aj etické výzvy, ktoré tento výskum prináša. Na tomto cieli sa chcem podieľať nielen prostredníctvom výskumu, ale aj výučbou, rozvojom mladých talentov a komunikáciou s verejnosťou.
Autor textu a foto: Jakub Bajzík
Institute of Science and Technology Austria
Viac takýchto článkov a exkluzívneho obsahu môžete získať vďaka predplatnému.
Máte predplatné?
Prihlásiť sa
