Napodobníme dokonale ľudský hlas?

Robot opera – minisympózium a predstavenie opery pre dva NAO roboty a violončelo v areáli University of Sussex, predstavenie sa konalo 16. júna 2017.

Umelá (syntetická) reč sa stáva súčasťou každodenného života. Znie v telefónnych odkazoch, ako výstražný signál rôznych zariadení, v hracích automatoch či z počítačov. Objavia sa na trhu prístroje, ktoré dokonale napodobnia hlasy ľudí?

Text pod titulkom je úvodom k článku, ktorý sme uverejnili v Quarku v auguste 1996. Mohol by byť úvodom k príspevku, ktorý sa venuje tej istej problematike aj na úrovni súčasných poznatkov. Napodobňovať ľudský hlas však už dokážeme predsa len lepšie ako v roku 1996. Do tohto výskumu vstupuje v posledných rokoch aj umelá inteligencia a využíva sa veľké množstvo získaných experimentálnych dát. A spievajúce roboty – o prvom z nich sa píše v závere článku – mali v nedávnej minulosti už aj niekoľko svojich vlastných operných predstavení. Prečítajte si, aké boli začiatky umelej reči:

Zvuk z hlasiviek

Pripomeňme si stručne, ako vzniká ľudský hlas v hrdle a v ústnej dutine. Keď hovoríme či spievame, vzduch prúdiaci z pľúc prechádza úzkou štrbinou v zadnej časti hrdla. Túto štrbinu tvoria dva prúžky pružného tkaniva – hlasivky. Prechádzajúci vzduch hlasivky rozkmitá, čím vzniká zvukový efekt. Zmenou prierezu štrbiny, teda reguláciou rýchlosti a tlaku prúdiaceho vzduchu, vznikajú frekvenčne odlíšiteľné zvuky, ktoré sa farebne upravujú nielen v ústnej dutine, ale aj nosovej a prínosových dutinách.

Prvé modely

Výskum rečovej simulácie pomocou mechanických modelov sa začal pred niekoľkými rokmi v Bellových laboratóriách v USA. V roku 1991 navrhli Flanagan a Landgraf dynamický model z jedného materiálu. V roku 1994 Ishizaka a Landgraf použili model už z dvoch materiálov. V roku 1996 vytvoril na univerzite v Iowe profesor Ingo R. Titze (National Centre for Voice and Speech) model z troch materiálov. Tento simulačný model je už dostatočne komplexný, veď napodobňuje aerodynamiku prúdiaceho vzduchu, akustické vlastnosti priestoru, elastické vlastnosti tkaniva, ako aj mechaniku samobudeného kmitania hlasiviek.

Spievajúci robot

V roku 1995, napriek chýbajúcim experimentálnym dátam, skonštruoval profesor I. R.Titze spievajúci robot. Dokázal, že spev možno ľahšie simulovať ako reč. Robotu dal meno PAVAROBOTTI, čím si chcel uctiť najväčšieho tenora vtedy Luciana Pavarottiho. Výhodou robota je, že generovanie čistých zvukov mu nerobí žiadne ťažkosti a navyše nepodlieha únave ako svaly, ktoré udržiavali v rezonancii Pavarottiho hlasivky. Preto je užitočný pri výchove operných spevákov. Spievajúci robot udržiava požadované tóny ľubovoľne dlho v nezmenenej podobe. Riadi ho počítač a používateľ ho môže používať opakovane. (Pokusy v laboratóriách ešte pokračovali, pozn. red.)

Profesor Ingo R. Titze dokázal, že spev možno simulovať ľahšie ako reč. V roku 1995 skonštruoval spievajúci robot, ktorému dal meno Pavarobotti.

Zatiaľ je to scI-fI

Hoci je to v súčasnosti predsa len v oblasti sci-fi, od takto modelovanej a poznanej geometrie mechaniky tvorby zvuku a iných potrebných konštánt mechanického modelu už nebude dlhá cesta k unikátnemu chirurgickému zákroku v reálnom ľudskom hrdle. Chirurgovia pomocou mechanikov – akustikov budú vyrábať dokonalých spevákov s požadovanými hlasmi.

Reč z Nottinghamu

Syntetizátor reči je veľmi dôležitou pomôckou pre tých, ktorí stratili schopnosť hovoriť. Umelé hlasy však znejú často ako roboty dosť neprirodzene. Výskumníci na univerzite v severoanglickom Nottinghame vyvíjajú umelý hlas, ktorý bude najviac pripomínať ľudský. Podľa nich sa vyznačuje vysokou kvalitou a domnievajú sa, že je najlepší na svete. Nový umelý hlas sa skladá z troch jednotiek podobne ako existujúce modely na trhu. Rozdiel je v tom, že tento počítač pracuje aj s časťami slov – poloslabikami. Vlastný systém premeny textu na reč sa zakladá na fonetických jednotkách. Hovoríme im poloslabiky, ktoré nahrávajú profesionálni hlásatelia. Poloslabiky potom použijú ako riadiace prvky umelého hlasu. Vedci už značne vylepšili kvalitu hlasu, ale ešte treba veľa urobiť, aby bol tento systém vhodný na trh. Nový umelý hlas sa dokáže naučiť nielen rôzne hlasové odtiene, ale bude môcť hovoriť aj s rôznymi prízvukmi.

R
foto University of Sussex, YouTube

Tento článok si môžete prečítať v časopise Quark 08/2019.

Ak chcete mať prístup aj k exkluzívnemu obsahu pre predplatiteľov alebo si objednať tlačenú verziu časopisu Quark, prihláste sa alebo zaregistrujte.

Komentáre