Blog

Der älteste Blog über KI in Tschechien

Wir schreiben über künstliche Intelligenz seit 2017. 1000+ Artikel, Tausende von Seiten voller Gedanken, Experimente und Reflexionen. Ohne Sensationen, ohne Werbung.

Tag-Filter: KI-Tools und Tipps × abbrechen

Nach Themen durchsuchen

Angezeigt 3 von 3 Artikeln

CzechCrunch hat über uns geschrieben: Mit Leoš Kyša über KI, Schreiben und wie sich unser Denken verändert
3 min

CzechCrunch hat über uns geschrieben: Mit Leoš Kyša über KI, Schreiben und wie sich unser Denken verändert

Über uns ist ein Artikel auf CzechCrunch erschienen, einem der einflussreichsten tschechischen Online-Magazine über Startups, Technologie und die digitale Wirtschaft. Mit dem Schriftsteller Leoš Kyša habe ich darüber gesprochen, wie wir über KI denken — nicht nur als Technologie, sondern als Werkzeug, das verändert, wie wir denken, erschaffen und entscheiden. Vielleicht ein „unbequemer" Standpunkt, aber gerade deshalb lesenswert.

Lesen
Eine Frage gegen zehn große Benchmarks: Wie gut hat der Mini-IQ-Test die Realität getroffen?
4 min

Eine Frage gegen zehn große Benchmarks: Wie gut hat der Mini-IQ-Test die Realität getroffen?

Vor ein paar Tagen habe ich den neuesten KI-Modellen nur eine einzige Frage gestellt — keinen Benchmark, keine Punktetabelle, nur eine intellektuelle Falle. Jetzt ist es Zeit, das Ergebnis mit den großen öffentlichen Benchmarks zu vergleichen, die seitdem erschienen sind. GPT-5.5 führt, Claude Opus 4.7 folgt dicht auf, Gemini 3.1 Pro war die größte Abweichung in meinem Test, DeepSeek V4 Pro lag am tiefsten. Eine Frage, die es sich lohnt, jedem Modell zu stellen — bevor man ihm vertraut.

Lesen
Eine Frage statt zehn Benchmarks: Mini-IQ-Test für die neuesten KI-Modelle
4 min

Eine Frage statt zehn Benchmarks: Mini-IQ-Test für die neuesten KI-Modelle

Ich habe die neuesten Top-KI-Modelle genommen und ihnen statt endloser Benchmarks eine einzige „geniale“ Frage gestellt: das versteckte Regel zu entdecken, einen neuen Fall zu berechnen, die Mehrdeutigkeit zuzugeben, einen Falsifikationstest vorzuschlagen und ihre eigene Lösung zu kritisieren. Das Ergebnis? Die Spitze liegt heute etwa im Bereich von 120–135+ IQ-Eindruck — aber der Unterschied liegt nicht mehr darin, was die Modelle wissen, sondern wie klar sie unter Druck denken können.

Lesen