Mit Freude teile ich Ihnen mit, dass OpenAI ein weiteres Produkt aus seiner bemerkenswerten Werkstatt veröffentlicht hat…
Mit Freude teile ich Ihnen mit, dass OpenAI ein weiteres Produkt aus seiner bemerkenswerten Werkstatt veröffentlicht hat. Es heißt „Whisper“. Whisper ist eine universelle End-to-End, schwach überwachte Familie von ASR-Modellen (Automatic Speech Recognition), die auf Transformatoren basieren. Gesagt einfach, es wandelt gesprochene Sprache in Text um. Und das auf eine Weise, die wir als „General-purpose“ bezeichnen, das heißt, neben der Spracherkennung kann es auch Aufgaben wie Sprachdetektion, Sprachidentifikation, Transkription und maschinelle Übersetzung durchführen.

Mit Freude teile ich Ihnen mit, dass OpenAI ein weiteres Produkt aus seiner bemerkenswerten Werkstatt veröffentlicht hat. Es heißt „Whisper“. Whisper ist eine universelle End-to-End, schwach überwachte Familie von ASR-Modellen (Automatic Speech Recognition), die auf Transformatoren basieren. Gesagt einfach, es wandelt gesprochene Sprache in Text um. Und das auf eine Weise, die wir als „General-purpose“ bezeichnen, das heißt, neben der Spracherkennung kann es auch Aufgaben wie Sprachdetektion, Sprachidentifikation, Transkription und maschinelle Übersetzung durchführen.
Es wird gleich eine ganze Familie von Modellen in verschiedenen Größen veröffentlicht. Von den kleinsten bis zu den größten hinsichtlich der Parameter: Tiny (39M), Basis (74B), klein (244B), mittel (769M) und groß (1,55B). Das Tolle ist, dass es als Open Source veröffentlicht wird! Interessierte können ganz einfach eine Online-Demo ausprobieren und sehen, wie das Modell auf Tschechisch funktioniert (oder die Neugierigen/geschickten unter Ihnen können es direkt von GitHub herunterladen). Noch eine kleine Perle zum Schluss. Die Modelle wurden auf 77 Jahren gesprochener Sprache trainiert, die aus dem Internet heruntergeladen wurde, was, so glaube ich, der größte ähnliche Datensatz seiner Art ist.
Quellen:
- Demo auf Hugging Face: https://huggingface.co/spaces/openai/whisper
- Open AI Blog: https://openai.com/blog/whisper/
- Paper: https://cdn.openai.com/papers/whisper.pdf
- GitHub: https://github.com/openai/whisper
- Colab: https://colab.research.google.com/github/openai/whisper/blob/master/notebooks/LibriSpeech.ipynb
- Medium: https://towardsdatascience.com/openai-whisper-holds-the-key-to-gpt-4-a7f922a7dad9
Ursprünglich veröffentlicht auf Facebook — Link zum Beitrag
Původní zdroj: facebook
Související články
November 2023
Gestern kam OpenAI mit einem Sturm an Innovationen! 🌀 Ihre verbesserten Anwendungen kommen…
LesenJuni 2023
Bereits seit ein paar Monaten alt (vor GPT-4), aber falls jemand es noch nicht gesehen hat ...
LesenMärz 2023