Zurück zum Blog
·Jan Tyl·1 min Lesezeit·Archiv 2020

Haben Sie schon von dem Konversationsagenten, also Chatbot, namens Meena gehört? Am…

Haben Sie schon von dem Konversationsagenten, also Chatbot, namens Meena gehört? Ende Januar wurde er von Google AI vorgestellt. Es handelt sich um ein robustes Modell mit 2,6 Milliarden Parametern. Die Architektur des Modells basiert auf 13 Dekodierungsblöcken des Evolved Tra

Haben Sie schon von dem Konversationsagenten, also Chatbot, namens Meena gehört? Am…

Haben Sie schon von dem Konversationsagenten, also Chatbot, namens Meena gehört? Ende Januar wurde er von Google AI vorgestellt. Es handelt sich um ein robustes Modell mit 2,6 Milliarden Parametern. Die Architektur des Modells basiert auf 13 Dekodierungsblöcken des Evolved Transformer seq2seq. Das Modell wurde mit 341 GB Text trainiert, hauptsächlich Konversationen aus sozialen Netzwerken (es ist also fast doppelt so groß wie GPT-2 und wurde mit 8,5-mal so vielen Daten trainiert). In den SSA-Tests (Sensibleness and Specificity Average) und bei der niedrigen Verwirrtheit schlägt es eindeutig konkurrierende Chatbots wie Mitsuku, Cleverbot, DialoGPT oder Xiaolce.

Das Problem alter Chatbots ist, dass sie nur in einem eng begrenzten Bereich gut sind und oft Schwierigkeiten haben, wenn das Gespräch in eine andere Richtung gelenkt wird. Zum Beispiel wäre für das Erlernen einer Fremdsprache oder für interaktive Spiele ein Bot mit einem breiten Spektrum an Konversationsthemen nützlich. Heutige Chatbots sagen zudem oft Unsinn. Sie schreiben Texte, die im Widerspruch zu dem stehen, was bereits gesagt wurde, sie fehlen grundlegende Kenntnisse über die Welt und gesunden Menschenverstand. Zu oft neigen sie dazu, mit Phrasen wie „Ich weiß nicht“ zu antworten. Das kann ich aus eigener Erfahrung bestätigen. Als ich vor etwa einem Jahr meinen eigenen Chatbot als Abschlussarbeit an der Moskauer Schule für künstliche Intelligenz (NRUHSE) erstellt habe, antwortete er viel zu oft mit „Ich weiß nicht“ :)

Die zukünftige Forschung an Meena wird versuchen, Attribute wie Persönlichkeit und Realität zu verbessern. Das Modell wurde der Öffentlichkeit bisher nicht zugänglich gemacht, obwohl seit Ende Januar darüber nachgedacht wird.

Blog: https://ai.googleblog.com/2020/01/towards-conversational-agent-that-can.html
Paper: https://arxiv.org/abs/2001.09977
Beispiele: https://github.com/google-research/google-research/tree/master/meena

Ursprünglich auf Facebook veröffentlicht — Link zum Beitrag

Původní zdroj: facebook

Související články