·Eva Popílková·1 min čítania·Archív 2019
Nové AI naklonuje váš hlas z pouhých 5 vteřin hlasového záznamu!
Nový výzkum nám představuje AI převádějící text na řeč (TTS). Algoritmus je tradičně založený na neuronové síti. Při podrobnějším pohledu se skládá ze 3…

Nový výzkum nám představuje AI převádějící text na řeč (TTS). Algoritmus je tradičně založený na neuronové síti. Při podrobnějším pohledu se skládá ze 3 hlavních komponent:
-
Speaker encoder network (naučený od tisíce řečníků – odtud zná systém jak zní lidský hlas.
-
Dále následuje síť pro syntézu sekvencí založená na Tacotronu 2, která generuje spektrogram z textu.
-
Jako poslední část slouží auto-regresivní vokodér založený na WaveNet, který převádí spektrum na sekvenci vzorků.
Více informací v odkazech.
Ukázka a základní vysvětlení:
Původní zdroj: wordpress
Související články
november 2019
Karen Hao analyzoval téměř 17 000 výzkumů o umělé inteligenci a napsal článek o tom, kam podle něj AI směřuje
Čítaťdecember 2019
Znáte český projekt OLS?
Čítaťnovember 2019