Jazykové nerovnosti - Časopis Quark

Dnešné veľké jazykové modely často deklarujú podporu desiatok jazykov vrátane slovenčiny. V praxi však tá istá technológia funguje v rôznych jazykoch rôzne a výsledky v slovenčine bývajú slabšie než v angličtine, navyše aj drahšie. Prečo je to tak a čo sa s tým dá robiť?

Muž používajúci telefón s ikonami rôznych jazykov — Foto istockphoto.com/Supatman

Predstavme si dve marketingové firmy, ktoré stoja pred rovnakou úlohou. Obe chcú vytvoriť nástroj na automatickú sumarizáciu interných dokumentov pomocou veľkých jazykových modelov. Prvá firma sídli v Londýne a pracuje s dokumentmi v angličtine. Druhá firma má sídlo v Bratislave a texty sú v slovenčine. Na prvý pohľad sa zdá, že obe majú rovnakú štartovaciu pozíciu.

Keď sa však pozrieme na výsledky, ilúzia rovnosti sa rýchlo rozpadá. Anglické sumarizácie sú presnejšie a konzistentnejšie, zatiaľ čo v slovenčine model častejšie vynecháva dôležité informácie či horšie pracuje s odborným jazykom. Pri výkonnosti a presnosti sa to však nekončí. Prečo to nie je prekvapivé? Čo sa s tým dá robiť? Odpovede na tieto otázky sú kľúčové, ak chceme porozumieť jazykovým nerovnostiam v umelej inteligencii (AI).

Univerzálny nástroj

Veľké jazykové modely (angl. large language models, LLM) sú modely, ktoré sa naučili pracovať s ľudským jazykom na základe obrovského množstva textových dát. Namiesto toho, aby mali vopred naprogramované pravidlá gramatiky či významu slov, učia sa zo vzorov v textoch: ktoré slová sa zvyknú objavovať spolu, v akom kontexte, v akom poradí a s akým významom. Jazykové modely sú trénované tak, aby čo najlepšie odhadli, aký text má nasledovať po texte, ktorý dostali na vstupe.

V praxi to znamená, že ten istý model dokáže sumarizovať dlhý dokument, preložiť ho do iného jazyka, odpovedať na otázky k jeho obsahu, prepísať ho do iného štýlu alebo viesť plynulý dialóg s človekom. Rozdiel medzi sumarizáciou zmluvy, odpovedaním v chatbote či generovaním marketingového textu nie je v samotnom modeli, ale v tom, akú inštrukciu dostane a s akým kontextom pracuje.

Zároveň ide o technológiu, ktorá sa správa zásadne inak než klasický softvér. Tradičný program robí presne to, čo mu vývojár napísal. Jazykový model sa, naopak, správa ako štatisticky vycvičený systém, ktorý generalizuje zo svojich skúseností. Pri tréningu modelov ich vieme učiť nasledovať inštrukcie a plniť požadované úlohy. Takto získame univerzálny nástroj.

Autonómni agenti

Tento posun umožnil vznik tzv. agentov postavených na veľkých jazykových modeloch. Agenti dokážu plánovať, rozdeliť si úlohu na menšie kroky a rozhodovať, aké akcie vykonajú ďalej (tieto akcie vedia zároveň delegovať na tzv. nástroje). Predstavme si napríklad marketingového agenta, ktorý dostane zadanie pripraviť prehľad kampane. Najprv si vyžiada dáta, potom ich analyzuje, následne vygeneruje súhrnný report a nakoniec navrhne úpravy stratégie. V zložitejších prípadoch spolupracuje viacero takýchto agentov: jeden sa stará o dáta, druhý o text, tretí o kontrolu kvality. Jazykový model sa tak postupne mení z odpovedača na otázky na aktívneho účastníka procesov.

Celý článok nájdete v časopise Quark 2/2026.

Vďaka predplatnému si ho však môžete dočítať už teraz a získať aj prístup k exkluzívnemu obsahu!

Máte predplatné?

Autori článku: Martin Tamajka a Timotej Králik
Kempelenov inštitút inteligentných technológií

Cookie	Dĺžka trvania	Popis
__wpdm_client	relácia	Technický súbor cookie, ktorý synchronizuje webovú stránku a CMS. Používa sa na aktualizáciu webovej stránky.
cookielawinfo-checkbox-advertisement	1 rok	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Reklama“.
cookielawinfo-checkbox-analytics	11 mesiacov	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Analytické“.
cookielawinfo-checkbox-necessary	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Nevyhnutné“.
CookieLawInfoConsent	1 rok	Tento súbor cookie zaznamená predvolený stav tlačidla zodpovedajúcej kategórie. Funguje iba v koordinácii s primárnym súborom cookie.
PHPSESSID	relácia	Tento súbor cookie je natívny pre aplikácie PHP. Súbor cookie sa používa na ukladanie a identifikáciu jedinečného ID relácie používateľa na účely riadenia relácie používateľa na webovej lokalite. Súbor cookie je súbor cookie relácie a vymaže sa, keď sa zatvoria všetky okná prehliadača.
viewed_cookie_policy	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookies. Neukladá žiadne osobné dáta.

Cookie	Dĺžka trvania	Popis
_ga	2 roky	Súbor cookie _ga nainštalovaný službou Google Analytics počíta údaje o návštevníkoch, reláciách a kampaniach a tiež sleduje používanie stránky pre analytický prehľad stránky. Súbor cookie ukladá informácie anonymne a priraďuje náhodne vygenerované číslo na rozpoznanie jedinečných návštevníkov.
_gat	1 minúta	Používa ho Google Analytics na zníženie počtu žiadostí.
_gid	1 deň	Súbor cookie _gid nainštalovaný službou Google Analytics ukladá informácie o tom, ako návštevníci používajú webovú stránku, a zároveň vytvára analytickú správu o výkonnosti webovej lokality. Niektoré zo zhromažďovaných údajov zahŕňajú počet návštevníkov, ich zdroj a stránky, ktoré anonymne navštevujú.
CONSENT	2 roky	YouTube nastavuje tento súbor cookie prostredníctvom vložených videí youtube a zaznamenáva anonymné štatistické údaje.

Cookie	Dĺžka trvania	Popis
fr	3 mesiace	Facebook nastavuje tento súbor cookie tak, aby používateľom zobrazoval relevantné reklamy sledovaním správania používateľov na webe, na stránkach, ktoré majú Facebook pixel alebo sociálny doplnok Facebook.
sb	2 roky	Tento súbor cookie používa Facebook na kontrolu svojich funkcií, zhromažďovanie jazykových nastavení a zdieľanie stránok.
VISITOR_INFO1_LIVE	5 mesiacov a 27 dní	Súbor cookie nastavený službou YouTube na meranie šírky pásma, ktorý určuje, či používateľ získa nové alebo staré rozhranie prehrávača.
YSC	relácia	Súbor cookie YSC nastavuje Youtube a používa sa na sledovanie zhliadnutí vložených videí cez stránku Youtube.
yt-remote-connected-devices		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.
yt-remote-device-id		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.

Univerzálny nástroj

Autonómni agenti

Celý článok nájdete v časopise Quark 2/2026.

Značky

Používanie cookies