Špičkový výskum sa dnes bez kvalitného analytického softvéru nezaobíde

Softvér SAS pomáha slovenským vedcom napríklad pri výskume rakoviny a pri ochrane biodiverzity. Výskumní pracovníci ho môžu využívať aj bezplatne cez Centrum vedecko-technických informácií SR.

Slovenská vedecká komunita sa, podobne ako zahraničná, v posledných rokoch potýka s narastajúcimi objemami dát. Platí to prakticky v každej disciplíne – od botaniky, cez medicínu, potravinárstvo a poľnohospodárstvo, až po výskum vesmíru.

Fyzici skúmajúci vesmír, ale ja výskumníci z iných odvetví v súčasnosti spracúvajú obrovské množstvo údajov, napríklad z družíc ako je Solar Dynamics Observatory, pri ktorom sa nezaobídu bez špecializovaného analytického softvéru.

Vedci a výskumníci na Slovensku sa však nemusia v záplavách dát stratiť. Pre svoju prácu majú k dispozícii takmer kompletnú ponuku modulov analytického softvéru SAS v podobe bezplatnej služby Integrovaného systému služieb Centra vedecko-technických informácií SR (ISS CVTI SR).

„Služba poskytuje registrovaným používateľom z inštitúcií, pre ktoré má CVTI SR zakúpené licencie, vzdialený prístup k SAS inštalovanom na výpočtovom klastri v Dátovom Centre pre výskum a vývoj v Žiline,“ hovorí Marián Trgala z Centra vedecko-technických informácií SR.

Čo dokáže softvér
Softvér SAS cez licencie CVTI zvykne využívať napríklad Karol Marhold, vedúci vedecký pracovník Slovenskej akadémie vied a profesor botaniky na Univerzite Karlovej, ktorý skúma divorastúce rastliny. Z terénu zhromažďuje desiatky až stovky populačných vzoriek, pričom každej rastline priradí istý počet znakov, či už ide o dáta o DNA, alebo z iných molekulárnych alebo morfologických analýz, čím vznikajú pomerne veľké objemy dát. Následnými analýzami z nich zisťuje, na čo sa treba zamerať pri ochrane biodiverzity, alebo ktoré druhy rastlín naopak nepotrebujú osobitú ochranu.

Významnú rolu pritom zohráva softvér SAS, ktorý K. Marhold využíva pri vedeckej činnosti už viac ako dve desaťročia. Zo všetkých údajov vytvára s kolegami matice a snažia sa multivariačnými metódami zistiť, či a ako sa na základe istých genetických, molekulárnych a morfologických znakov líšia rastliny z rôznych geografických oblastí. „Máme pomerne veľké matice, ktoré sa bez štatistického nástroja nedajú vyhodnocovať. Z celého spektra balíka SAS používame najmä základnú štatistiku a multivariačné analýzy, či už zhlukové analýzy, diskriminačné analýzy, alebo analýzy hlavných komponentov,“ vysvetľuje K. Marhold.

Ktorá liečba zaberá?
Obdobným spôsobom sa dá štatistický a analytický softvér využiť aj v medicíne – napríklad keď potrebujú vedeckí pracovníci porovnávať úspešnosť liečby A s liečbou B. V onkológii je jedným z najvhodnejších spôsobov, ako to urobiť, vyhodnotiť celkové prežívanie. „Ide o proces, ktorý by si v Exceli vyžadoval niekoľkostupňový výpočet, a ak by sme ho chceli spracovať aj vzhľadom na viacero iných parametrov súčasne, čiže využiť multivariačný model, bez špecializovaného softvéru by sme si s tým neporadili,“ vysvetľuje lekárka Silvia Cingelová, ktorá sa venuje výskumu onkologických ochorení. Pripomína, že takto vyhodnotené údaje sú nevyhnutné aj pri zverejňovaní výsledkov v odborných časopisoch alebo pri prednáškach.

Cingelová takisto používa SAS už niekoľko rokov. Najskôr išlo o SAS Enterprise Guide, pomocou ktorého spracúvala údaje o prežívaní pacientov s nádormi pľúc, ktorí boli liečení odlišnými postupmi. Zložitejšie spracovanie údajov neskôr robila aj v softvéri SAS Enerprise Miner, v ktorom napríklad zisťovala, ako súvisí hladina niekoľkých špecifických látok v krvi s úspešnou liečbou rakoviny. „Zisťovali sme to pomocou rozhodovacieho stromu, ktorý vybral najúspešnejšiu kombináciu parametrov,“ vysvetľuje.

Genetické experimenty
SAS našiel v slovenskej vedeckej komunite uplatnenie nielen v biológii a medicíne, ale aj v oblasti poľnohospodárskych a potravinárskych vied. Výskumníci z Národného poľnohospodárskeho a potravinárskeho centra (NPPC) používajú softvér SAS už od konca 90-tych rokov. Odborníci na genetiku zameranú na hospodárske zvieratá s ním dokážu vyhodnocovať experimenty v oblasti populačnej a molekulárnej genetiky, napríklad pokusy a experimenty zamerané na skúmanie vplyvu rôznych genetických variantov na úžitkové a funkčné vlastnosti zvierat.

Odborníci zameraní na rastlinnú produkciu zvyknú pomocou SASu plánovať a vyhodnocovať poľné experimenty a pokusy v oblasti genetiky rastlín. „SAS má vynikajúce nástroje na modelovanie. Komplexné modely, ktorými vieme vyhodnotiť a kvantifikovať vplyv rôznych genetických a negenetických faktorov na rôzne produkčné a i kvalitatívne ukazovatele hospodárskych zvierat, rastlín, pôdnych vlastností, využívajú vedci na všetkých našich pracoviskách,“ uviedla Dana Peškovičová, zástupkyňa generálneho riaditeľa pre výskum NPCC.

Pre koho a kde
Automatizované skúmanie veľkých objemov dát s využitím moderných analytických metód dokáže skrátiť čas potrebný na ich analýzu, a to nielen pri skúmaní slnka či vesmíru, vyhodnocovaní liečby rakoviny či pri ochrane biodiverzity, ale pri akomkoľvek výskume, pri ktorom treba spracovať veľké množstvá dát. Vedcov odbremeňuje od manuálnych, časovo náročných a často sa opakujúcich úloh a umožňuje im tak viac sa sústrediť na samotný výskum.

Detaily o softvéri poskytovanom cez Centrum vedecko-technických informácií nájdu záujemcovia na portáli iss.cvtisr.sk, kde sa môžu aj zaregistrovať a objednať si službu. „Prostredníctvom portálu poskytujeme širšiu paletu bezplatných služieb s ponukou aj ďalších softvérových balíkov pre potreby vedcov a výskumníkov. Oprávnenými používateľmi služieb ISS CVTI SR sú predovšetkým študenti a zamestnanci licencovaných vedecko-výskumných inštitúcií a vysokých škôl v SR, ktoré sú financované z verejných zdrojov.“ dopĺňa Marián Trgala z Centra vedecko-technických informácií SR.

Výzva
Ak chce slovenská vedecká komunita robiť kvalitný výskum a vývoj, potrebuje k tomu špičkový analytický softvér, ktorý umožňuje skúmať veľké objemy dát a robiť analýzy, aké kancelársky tabuľkový kalkulátor nezvládne.

Riešenie
Zamestnanci vedecko-výskumných inštitúcií v SR, ale aj študenti, môžu využívať cez cloud širokú ponuku modulov analytického softvéru SAS v podobe bezplatnej služby Integrovaného systému služieb Centra vedecko-technických informácií SR.

Prínosy
Analytický a štatistický softvér SAS umožňuje vedcom spracúvať dáta a robiť analýzy, ktoré by inak nezvládli. Odbremeňuje ich tiež od manuálnych, časovo náročných a často sa opakujúcich úloh a umožňuje im tak viac sa sústrediť na samotný výskum.