CABOWITZ: Připomnělo mi to Play.ht, kteří za pár dolarů za sub prodávají hyperrealistické syntetické hlasy. Jejich novinka, klonování hlasů, je podmíněna písemným souhlasem majitele hlasu a užitím jen pro legální účely, ale to samozřejmě jen do doby, než vznikne open source varianta a skončí dohled nad čímkoli. Na zkoušku syntetizovali hlasy Elona Muska, Toma Hankse, Joe Rogana, Kevina Harta nebo JFK a myslím, že bez upozornění a pekelného soustředění by to málokdo poznal:
https://play.ht/voice-cloning/ Jsme skoro na začátku filmové verze Futurologického kongresu, kde chtějí herečku za prachy kompletně zdigitalizovat za jednorázový a finální honorář. Na základě jejich modelu vznikl např.
pohttps://podcast.ai/, rozhovory s mrtvými osobnostmi, kdy transkript vytvořil ChatGPT a hlasy syntetizovalo Play.ht na základě dochovaných vzorků.
Microsoft se nemůže nechat zahanbit a pracuje na VALL-E, nástroji pro TTS syntézu, který na základě 3 vteřin rekonstruuje lidský hlas a umí i měnit modulaci, intonaci a automaticky emulovat nálady, takže bye bye načítači rozhlasových her nebo audioknih:
https://valle-demo.github.io/