Blog
Der älteste Blog über KI in Tschechien
Wir schreiben über künstliche Intelligenz seit 2017. 1000+ Artikel, Tausende von Seiten voller Gedanken, Experimente und Reflexionen. Ohne Sensationen, ohne Werbung.
Tag-Filter: KI-Modelle × abbrechen
▸Nach Themen durchsuchen
Themen
Angezeigt 2 von 2 Artikeln

Eine Frage gegen zehn große Benchmarks: Wie gut hat der Mini-IQ-Test die Realität getroffen?
Vor ein paar Tagen habe ich den neuesten KI-Modellen nur eine einzige Frage gestellt — keinen Benchmark, keine Punktetabelle, nur eine intellektuelle Falle. Jetzt ist es Zeit, das Ergebnis mit den großen öffentlichen Benchmarks zu vergleichen, die seitdem erschienen sind. GPT-5.5 führt, Claude Opus 4.7 folgt dicht auf, Gemini 3.1 Pro war die größte Abweichung in meinem Test, DeepSeek V4 Pro lag am tiefsten. Eine Frage, die es sich lohnt, jedem Modell zu stellen — bevor man ihm vertraut.
Lesen
Eine Frage statt zehn Benchmarks: Mini-IQ-Test für die neuesten KI-Modelle
Ich habe die neuesten Top-KI-Modelle genommen und ihnen statt endloser Benchmarks eine einzige „geniale“ Frage gestellt: das versteckte Regel zu entdecken, einen neuen Fall zu berechnen, die Mehrdeutigkeit zuzugeben, einen Falsifikationstest vorzuschlagen und ihre eigene Lösung zu kritisieren. Das Ergebnis? Die Spitze liegt heute etwa im Bereich von 120–135+ IQ-Eindruck — aber der Unterschied liegt nicht mehr darin, was die Modelle wissen, sondern wie klar sie unter Druck denken können.
Lesen