Blog
Najstarszyblog o sztucznej inteligencji w Czechach
O sztucznej inteligencji piszemy od 2017 roku. 1000+ artykułów, tysiące stron przemyśleń, eksperymentów i refleksji. Bez szumu i reklam.
Filtr tagów: GPT-5.5 × anuluj
▸Przeglądaj według tematu
Tematy
Wyświetlono 2 z 2 artykułów

Jedno pytanie kontra dziesięć dużych testów porównawczych: jak dobrze wypadł mini test IQ?
Kilka dni temu zadałem najnowszym modelom sztucznej inteligencji tylko jedno pytanie – nie był to punkt odniesienia, ani tablica wyników, tylko pojedyncza pułapka intelektualna. Po kilku dniach przychodzi czas na porównanie wyniku z dużymi publicznymi benchmarkami, które pojawiły się w międzyczasie. Prowadzi GPT-5.5, tuż za nim Claude Opus 4.7, największym odchyleniem jest Gemini 3.1 Pro, najniższym DeepSeek V4 Pro. Pytanie, które warto zadać każdemu modelowi – zanim zaczniesz mu ufać.
Czytaj
Jedno pytanie zamiast dziesięciu benchmarków: mini test IQ dla najnowszych modeli AI
Wziąłem najnowsze najlepsze modele sztucznej inteligencji i zamiast niekończących się testów porównawczych zadałem im jedno „genialne” pytanie: odkryj ukrytą regułę, oblicz nowy przypadek, przyznaj się do niejednoznaczności, zaprojektuj test fałszowania i przeanalizuj własne rozwiązanie. Wynik? Dzisiejszy szczyt mieści się mniej więcej w przedziale 120–135+ IQ – ale różnica nie polega już na tym, co wiedzą modele, ale na tym, jak wyraźnie potrafią myśleć pod presją.
Czytaj