9. Mai 2021·Jan Tyl·1 min Lesezeit·Archiv 2021

Das Google Research Brain-Team stellte die neue Architektur für Computer Vision MLP-Mixer vor

Das Google Research Brain-Team stellte die neue Architektur für Computer Vision MLP-Mixer vor. In letzter Zeit sind netzwerkbasierte Modelle, die auf Aufmerksamkeit beruhen, wie der Vision Transformer, populär geworden. In dem Beitrag des Google Research Brain-Teams stellte eine Gruppe von Wissenschaftlern vor

In letzter Zeit sind netzwerkbasierte Modelle, die auf Aufmerksamkeit beruhen, wie der Vision Transformer, populär geworden. In dem Beitrag des Google Research Brain-Teams stellte eine Gruppe von Wissenschaftlern den MLP-Mixer vor, eine Architektur, die ausschließlich auf mehrschichtigen Perzeptronen (MLP) basiert. Der MLP-Mixer enthält zwei Arten von Schichten: eine mit MLP, die unabhängig von den Bild-Patches angewendet wird (d.h. „Mischen“ von Funktionen nach Ort) und eine andere mit MLP über die Patches hinweg (d.h. „Mischen“ von räumlichen Informationen). Als der MLP-Mixer auf großen Datensätzen trainiert wurde, erzielte er ähnliche Ergebnisse wie die neuesten Modelle. Die Gruppe von Wissenschaftlern hofft, dass diese Ergebnisse weitere Forschungen über die gut etablierten CNNs und Transformer hinaus anregen werden.

Quelle:

Ursprünglich veröffentlicht auf Facebook — Link zum Beitrag

Původní zdroj: facebook

Související články

November 2022

Das Google Research Brain-Team stellte die neue Architektur für Computer Vision MLP-Mixer vor

Související články

Macht es Ihnen Spaß, Bilder zu generieren?🎨 Und kennen Sie den CLIP Interrogator? Als Eingabe fügen Sie ein Bild…

Liebe Freunde☀️!

Cool und übersichtlicher Vergleich. Auch wenn ich die Schlussfolgerungen als ziemlich irreführend empfinde.