Zurück zum Blog
·Jan Tyl·1 min Lesezeit·Archiv 2022

Mit Freude teile ich Ihnen mit, dass OpenAI ein weiteres Produkt aus seiner bemerkenswerten Werkstatt veröffentlicht hat…

Mit Freude teile ich Ihnen mit, dass OpenAI ein weiteres Produkt aus seiner bemerkenswerten Werkstatt veröffentlicht hat. Es heißt „Whisper“. Whisper ist eine universelle End-to-End, schwach überwachte Familie von ASR-Modellen (Automatic Speech Recognition), die auf Transformatoren basieren. Gesagt einfach, es wandelt gesprochene Sprache in Text um. Und das auf eine Weise, die wir als „General-purpose“ bezeichnen, das heißt, neben der Spracherkennung kann es auch Aufgaben wie Sprachdetektion, Sprachidentifikation, Transkription und maschinelle Übersetzung durchführen.

Mit Freude teile ich Ihnen mit, dass OpenAI ein weiteres Produkt aus seiner bemerkenswerten Werkstatt veröffentlicht hat…

Mit Freude teile ich Ihnen mit, dass OpenAI ein weiteres Produkt aus seiner bemerkenswerten Werkstatt veröffentlicht hat. Es heißt „Whisper“. Whisper ist eine universelle End-to-End, schwach überwachte Familie von ASR-Modellen (Automatic Speech Recognition), die auf Transformatoren basieren. Gesagt einfach, es wandelt gesprochene Sprache in Text um. Und das auf eine Weise, die wir als „General-purpose“ bezeichnen, das heißt, neben der Spracherkennung kann es auch Aufgaben wie Sprachdetektion, Sprachidentifikation, Transkription und maschinelle Übersetzung durchführen.

Es wird gleich eine ganze Familie von Modellen in verschiedenen Größen veröffentlicht. Von den kleinsten bis zu den größten hinsichtlich der Parameter: Tiny (39M), Basis (74B), klein (244B), mittel (769M) und groß (1,55B). Das Tolle ist, dass es als Open Source veröffentlicht wird! Interessierte können ganz einfach eine Online-Demo ausprobieren und sehen, wie das Modell auf Tschechisch funktioniert (oder die Neugierigen/geschickten unter Ihnen können es direkt von GitHub herunterladen). Noch eine kleine Perle zum Schluss. Die Modelle wurden auf 77 Jahren gesprochener Sprache trainiert, die aus dem Internet heruntergeladen wurde, was, so glaube ich, der größte ähnliche Datensatz seiner Art ist.

Quellen:

  • Demo auf Hugging Face: https://huggingface.co/spaces/openai/whisper
  • Open AI Blog: https://openai.com/blog/whisper/
  • Paper: https://cdn.openai.com/papers/whisper.pdf
  • GitHub: https://github.com/openai/whisper
  • Colab: https://colab.research.google.com/github/openai/whisper/blob/master/notebooks/LibriSpeech.ipynb
  • Medium: https://towardsdatascience.com/openai-whisper-holds-the-key-to-gpt-4-a7f922a7dad9

Ursprünglich veröffentlicht auf Facebook — Link zum Beitrag

Původní zdroj: facebook

Související články