Spoľahlivé mantinely

V druhej časti článku o bezpečnostných rizikách pri práci s umelou inteligenciou sa dozviete viac o opatreniach, ktoré zavádzajú autori jednej z najväčších platforiem na šírenie verejných veľkých jazykových modelov, aj o nastavovaní mantinelov či dotrénovaní modelu pre vlastnú doménu.

Ako sme písali v októbrovom vydaní, na platformu Hugging Face môže model umelej inteligencie, napríklad aj veľký jazykový model ako ChatGPT, nahrať hocikto vrátane útočníka. Škodlivý kód môže byť ukrytý v parametroch modelu, v datasete alebo v zdrojovom kóde určenom na stiahnutie alebo spustenie modelu. Po spustení môže útočník získať kontrolu nad vaším systémom.

Autori platformy si tieto riziká uvedomujú a zavádzajú opatrenia, ktoré majú podobným útokom predchádzať. Aj tak je však dôležité byť obozretný a dodržiavať odporúčané bezpečnostné opatrenia, a to aj pri práci s otvorenými modelmi, ktoré pochádzajú zo zdanlivo dôveryhodných zdrojov.

Muž interagujúci s digitálnymi červenými výstražnými ikonami a dátovou grafikou
Foto istockphoto.com/ismagilov

Overovanie dôveryhodnosti autora

Každý model na platforme Hugging Face opisuje tzv. modelová karta. Ide o krátku dokumentáciu modelu, v ktorej by mali byť uvedené jeho popis, príklady použitia, obmedzenia a prípadne odkazy na pridružený výskumný článok či repozitár so zdrojovým kódom. Kvalitný model od renomovaného autora si spravidla zaslúži aj kvalitne spracovaný popis. Sťahovanie modelov od úplne neznámych autorov bez akýchkoľvek informácií môže síce priniesť zaujímavý objav, pomerne často však vedie k problémom alebo sklamaniu. Dobrou praxou je pozrieť si, či má autor modelu na platforme dlhodobú aktivitu a či jeho modely používa komunita.

Modelová karta
Každý model na plat­forme Hugging Face opisuje tzv. modelová karta, screenshot huggingface.co.

Používanie bezpečných formátov

Modely na platformách ako Hugging Face bývajú uložené v rôznych formátoch, ako Pickle alebo safetensors. Existujú formáty, ktoré umožňujú veľmi jednoducho vložiť škodlivý kód, najznámejším z nich je Pickle. Pri sťahovaní a spúšťaní súborov v tomto formáte buďte mimoriadne opatrní. Aj priemerný programátor (napr. aj s pomocou AI asistenta) dokáže v priebehu niekoľkých hodín pripraviť škodlivý súbor vo formáte Pickle a zverejniť ho na internete, odkiaľ si ho môžu nič netušiaci používatelia stiahnuť a spustiť u seba na počítači.

Hugging Face o tomto riziku vie a preto automaticky skenuje nahraté modely. Dokáže tak upozorniť používateľov, že formát, v ktorom je model uložený, môže byť potenciálne nebezpečný – to je presne prípad formátu Pickle. Napriek tomu je v tomto prípade vhodné byť zdravo para­noidný a radšej siahať po bezpečnejšom formáte safetensors. Tento formát vyvinutý priamo tímom Hugging Face je optimalizovaný na rýchle načítavanie a neumožňuje vloženie spustiteľného kódu.

Celý článok nájdete v časopise Quark 11/2025.

Vďaka predplatnému si ho však môžete dočítať už teraz a získať aj prístup k exkluzívnemu obsahu!

Máte predplatné?

Autori článku: Timotej Králik, Martin Tamajka
Kempelenov inštitút inteligentných technológií