Malá veľká kompresia

Internet je plný obrázkov a videí. Milióny používateľov v každom momente 24 hodín denne scrollujú sociálnymi sieťami a všetky tie údaje sa k nim musia spoľahlivo a rýchlo dostať.

Najviac používaným spôsobom na zobrazovanie digitálnych obrázkov je formát RGB (červená, zelená, modrá, z angl. red, green, blue). Každý pixel obrázka nadobúda hodnotu od 0 do 255 pre každú z týchto troch farieb a ich spojením vznikne výsledná farba pixelu. Ponúka to až 16,5 milióna možných farieb pre každý pixel. Prečo je možných hodnôt pre každú farbu také neokrúhle číslo ako 256? Pretože toto číslo je okrúhle v dvojkovej sústave – je to 28, čo je veľká výhoda pre počítače, ktoré fungujú na základe dvojkovej sústavy.

Nekomprimovaný obrázok

Jedna informácia pre počítač sa nazýva jeden bit, tzv. zapnutá alebo vypnutá žiarovka, jednotka alebo nula. A práve osem bitov tvorí jeden bajt. Následne 1 000 bajtov tvorí jeden kilobajt (kB), 1 000 kilobajtov tvorí jeden megabajt (MB). Keď máme pre jeden pixel uloženú informáciu o farbe v podobe troch hodnôt od 0 po 255, teda 28 možných hodnôt, táto informácia bude zaberať tri bajty pamäte na harddisku.
Súčasné profesionálne fotoaparáty alebo aj drahšie mobilné telefóny zhotovujú fotografie v pomerne vysokom rozlíšení. Úplne bežne je to 6 000 × 4 000 pixelov pre jednu fotografiu. To je 24 miliónov jednotlivých pixelov, čo sa často uvádza aj ako 24 megapixelov. Hodnoty RGB môžeme uložiť do troch tabuliek s rovnakými počtami stĺpcov a riadkov, ako je rozlíšenie obrázka. To je veľa možných hodnôt pre farbu každého jedného z nich. Vychádza to až 68 MB na jeden obrázok, čo je enormné množstvo údajov, keď si predstavíme, že by sme si so štandardným balíčkom od operátora 1 GB na mesiac dokázali prezrieť iba 15 takto kvalitných obrázkov.
Bolo by nerentabilné prenášať medzi používateľmi taký objem údajov. Nehovoriac o videu, ktoré sa skladá najčastejšie z 25 obrázkov za sekundu, v niektorých prípadoch až 50. Pre tieto dôvody boli vymyslené algoritmy na optimalizáciu a kompresiu obrázkov.

História

Najviac rozšíreným formátom na kompresiu obrázkov je JPEG, skratka z anglického Joint Photographic Experts Group. Ako napovedá anglický názov, ide o spojenie viacerých skupín vedeckých expertov na fotografiu. Vzniklo už v roku 1986, keď sa niekoľko separátnych skupín dohodlo na zjednotení používaných technológií pre digitálne obrázky.
Samotný formát obrázkov JPEG bol vytvorený v roku 1992 a pomenovali ho práve po názve svojej skupiny. Spôsobil veľký rozmach technológií, aj keď v tom čase bol internet ešte iba v začiatkoch. Obrázky však vďaka nemu začali vo väčšom rozsahu používať rôzne terminály, informačné tabule, automatizované stroje či herné konzoly.

Pokračovanie článku si môžete prečítať v časopise Quark 10/2023. Ak chcete mať prístup k exkluzívnemu obsahu pre predplatiteľov, prihláste sa. Ak ešte nie ste naším predplatiteľom, objednajte si predplatné podľa vášho výberu tu.

Text a foto Stanislav Griguš
Fakulta matematiky, fyziky a informatiky
Univerzita Komenského v Bratislave
Videá autora nájdete na YouTube kanáli To ako prečo?