Spoľahlivé mantinely - Časopis Quark

V druhej časti článku o bezpečnostných rizikách pri práci s umelou inteligenciou sa dozviete viac o opatreniach, ktoré zavádzajú autori jednej z najväčších platforiem na šírenie verejných veľkých jazykových modelov, aj o nastavovaní mantinelov či dotrénovaní modelu pre vlastnú doménu.

Ako sme písali v októbrovom vydaní, na platformu Hugging Face môže model umelej inteligencie, napríklad aj veľký jazykový model ako ChatGPT, nahrať hocikto vrátane útočníka. Škodlivý kód môže byť ukrytý v parametroch modelu, v datasete alebo v zdrojovom kóde určenom na stiahnutie alebo spustenie modelu. Po spustení môže útočník získať kontrolu nad vaším systémom.

Autori platformy si tieto riziká uvedomujú a zavádzajú opatrenia, ktoré majú podobným útokom predchádzať. Aj tak je však dôležité byť obozretný a dodržiavať odporúčané bezpečnostné opatrenia, a to aj pri práci s otvorenými modelmi, ktoré pochádzajú zo zdanlivo dôveryhodných zdrojov.

Muž interagujúci s digitálnymi červenými výstražnými ikonami a dátovou grafikou — Foto istockphoto.com/ismagilov

Overovanie dôveryhodnosti autora

Každý model na platforme Hugging Face opisuje tzv. modelová karta. Ide o krátku dokumentáciu modelu, v ktorej by mali byť uvedené jeho popis, príklady použitia, obmedzenia a prípadne odkazy na pridružený výskumný článok či repozitár so zdrojovým kódom. Kvalitný model od renomovaného autora si spravidla zaslúži aj kvalitne spracovaný popis. Sťahovanie modelov od úplne neznámych autorov bez akýchkoľvek informácií môže síce priniesť zaujímavý objav, pomerne často však vedie k problémom alebo sklamaniu. Dobrou praxou je pozrieť si, či má autor modelu na platforme dlhodobú aktivitu a či jeho modely používa komunita.

Používanie bezpečných formátov

Modely na platformách ako Hugging Face bývajú uložené v rôznych formátoch, ako Pickle alebo safetensors. Existujú formáty, ktoré umožňujú veľmi jednoducho vložiť škodlivý kód, najznámejším z nich je Pickle. Pri sťahovaní a spúšťaní súborov v tomto formáte buďte mimoriadne opatrní. Aj priemerný programátor (napr. aj s pomocou AI asistenta) dokáže v priebehu niekoľkých hodín pripraviť škodlivý súbor vo formáte Pickle a zverejniť ho na internete, odkiaľ si ho môžu nič netušiaci používatelia stiahnuť a spustiť u seba na počítači.

Hugging Face o tomto riziku vie a preto automaticky skenuje nahraté modely. Dokáže tak upozorniť používateľov, že formát, v ktorom je model uložený, môže byť potenciálne nebezpečný – to je presne prípad formátu Pickle. Napriek tomu je v tomto prípade vhodné byť zdravo paranoidný a radšej siahať po bezpečnejšom formáte safetensors. Tento formát vyvinutý priamo tímom Hugging Face je optimalizovaný na rýchle načítavanie a neumožňuje vloženie spustiteľného kódu.

Celý článok nájdete v časopise Quark 11/2025.

Vďaka predplatnému si ho však môžete dočítať už teraz a získať aj prístup k exkluzívnemu obsahu!

Máte predplatné?

Autori článku: Timotej Králik, Martin Tamajka
Kempelenov inštitút inteligentných technológií

Cookie	Dĺžka trvania	Popis
__wpdm_client	relácia	Technický súbor cookie, ktorý synchronizuje webovú stránku a CMS. Používa sa na aktualizáciu webovej stránky.
cookielawinfo-checkbox-advertisement	1 rok	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Reklama“.
cookielawinfo-checkbox-analytics	11 mesiacov	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Analytické“.
cookielawinfo-checkbox-necessary	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Nevyhnutné“.
CookieLawInfoConsent	1 rok	Tento súbor cookie zaznamená predvolený stav tlačidla zodpovedajúcej kategórie. Funguje iba v koordinácii s primárnym súborom cookie.
PHPSESSID	relácia	Tento súbor cookie je natívny pre aplikácie PHP. Súbor cookie sa používa na ukladanie a identifikáciu jedinečného ID relácie používateľa na účely riadenia relácie používateľa na webovej lokalite. Súbor cookie je súbor cookie relácie a vymaže sa, keď sa zatvoria všetky okná prehliadača.
viewed_cookie_policy	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookies. Neukladá žiadne osobné dáta.

Cookie	Dĺžka trvania	Popis
_ga	2 roky	Súbor cookie _ga nainštalovaný službou Google Analytics počíta údaje o návštevníkoch, reláciách a kampaniach a tiež sleduje používanie stránky pre analytický prehľad stránky. Súbor cookie ukladá informácie anonymne a priraďuje náhodne vygenerované číslo na rozpoznanie jedinečných návštevníkov.
_gat	1 minúta	Používa ho Google Analytics na zníženie počtu žiadostí.
_gid	1 deň	Súbor cookie _gid nainštalovaný službou Google Analytics ukladá informácie o tom, ako návštevníci používajú webovú stránku, a zároveň vytvára analytickú správu o výkonnosti webovej lokality. Niektoré zo zhromažďovaných údajov zahŕňajú počet návštevníkov, ich zdroj a stránky, ktoré anonymne navštevujú.
CONSENT	2 roky	YouTube nastavuje tento súbor cookie prostredníctvom vložených videí youtube a zaznamenáva anonymné štatistické údaje.

Cookie	Dĺžka trvania	Popis
fr	3 mesiace	Facebook nastavuje tento súbor cookie tak, aby používateľom zobrazoval relevantné reklamy sledovaním správania používateľov na webe, na stránkach, ktoré majú Facebook pixel alebo sociálny doplnok Facebook.
sb	2 roky	Tento súbor cookie používa Facebook na kontrolu svojich funkcií, zhromažďovanie jazykových nastavení a zdieľanie stránok.
VISITOR_INFO1_LIVE	5 mesiacov a 27 dní	Súbor cookie nastavený službou YouTube na meranie šírky pásma, ktorý určuje, či používateľ získa nové alebo staré rozhranie prehrávača.
YSC	relácia	Súbor cookie YSC nastavuje Youtube a používa sa na sledovanie zhliadnutí vložených videí cez stránku Youtube.
yt-remote-connected-devices		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.
yt-remote-device-id		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.

Overovanie dôveryhodnosti autora

Používanie bezpečných formátov

Celý článok nájdete v časopise Quark 11/2025.

Značky

Používanie cookies