Neue KI klont Ihre Stimme aus nur 5 Sekunden Sprachaufnahme!
Neue Forschung präsentiert uns eine KI, die Text in Sprache (TTS) umwandelt. Der Algorithmus basiert traditionell auf einem neuronalen Netzwerk. Bei näherer Betrachtung besteht es aus 3 Hauptkomponenten…

Neue Forschung präsentiert uns eine KI, die Text in Sprache (TTS) umwandelt. Der Algorithmus basiert traditionell auf einem neuronalen Netzwerk. Bei näherer Betrachtung besteht es aus 3 Hauptkomponenten:
-
Speaker Encoder Netzwerk (gelernt von Tausenden von Sprechern – so kennt das System, wie eine menschliche Stimme klingt).
-
Danach folgt ein Sequenzsynthese-Netzwerk, das auf Tacotron 2 basiert und ein Spektrogramm aus Text generiert.
-
Als letzter Teil dient ein auto-regressiver Vokoder, der auf WaveNet basiert, welcher das Spektrum in eine Sequenz von Samples umwandelt.
Mehr Informationen in den Links.
Beispiel und grundlegende Erklärung:
Původní zdroj: wordpress
Související články
Dezember 2019
Kennen Sie das tschechische Projekt OLS?
LesenNovember 2019
„Echte KI sollte die Beziehung zwischen Ursache und Wirkung verstehen“, sagt Judea Pearl, Pionier auf dem Gebiet der künstlichen Intelligenz.
LesenNovember 2019