Zurück zum Blog
·Honza Tyl·1 min Lesezeit·Archiv 2019

Unsupervised MT - Maschinenlernen ohne Lehrer

Es ist immer noch eher ein Konzept, dessen Ergebnisse relativ schwach sind, aber ich bin überrascht, dass es überhaupt funktioniert. Schauen wir uns maschinelle Übersetzung an. Klassisch…

Unsupervised MT - Maschinenlernen ohne Lehrer

Es ist immer noch eher ein Konzept, dessen Ergebnisse relativ schwach sind, aber ich bin überrascht, dass es überhaupt funktioniert. Schauen wir uns die maschinelle Übersetzung an. Klassischerweise wird maschinelle Übersetzung heute so durchgeführt, dass man eine große Menge an parallelen Sätzen hat (z. B. im Tschechischen und Englischen den gleichen Satz „Miluji tě.“ = „I love you.“).

Letztes Jahr habe ich hier meine Ergebnisse veröffentlicht, wie ich einen Computer in 15 Minuten Tschechisch/Englisch beigebracht habe. Es war klassisches Lernen mit einem Lehrer. Während des Trainings habe ich dem System gesagt, was ich für eine gute Übersetzung halte.

Dieser Ansatz ist jedoch anders. Worin besteht der Unterschied? Sie füttern den Computer nicht mit parallelen Sätzen, sondern mit zwei großen monolingualen Korpora in jeder Sprache. Der ganze Trick besteht darin, dass innerhalb dieses Algorithmus automatisch parallele Daten durch iteratives Rückübersetzen generiert werden.

Quellen:
https://arxiv.org/pdf/1804.07755v2.pdf
https://arxiv.org/abs/1804.07755
http://ruder.io/10-exciting-ideas-of-2018-in-nlp/…
GIT: https://github.com/facebookresearch/UnsupervisedMT

Původní zdroj: wordpress

Související články