🔁 GPT‑5 je tady!
🔁 GPT‑5 je tady! 🧠 TL;DR: OpenAI dnes spustilo GPT‑5. V ChatGPT se postupně stává výchozím modelem pro Free, Plus, Pro, Team i Enterprise a v API je k dispozici jako gpt‑5 / gpt‑5‑mini / gpt‑5‑nano. Novinkou je „router“, který automatick

🔁 GPT‑5 je tady!
🧠 TL;DR: OpenAI dnes spustilo GPT‑5. V ChatGPT se postupně stává výchozím modelem pro Free, Plus, Pro, Team i Enterprise a v API je k dispozici jako gpt‑5 / gpt‑5‑mini / gpt‑5‑nano. Novinkou je „router“, který automaticky volí rychlý vs. „thinking“ režim podle úlohy; uživatel může říct i explicitně „think hard about this“. Výrazně klesají halucinace v zdravotnických scénářích (na 1,6 % na HealthBench Hard Hallucinations). V kódování dosahuje 74,9 % na SWE‑bench Verified. Nasazení běží celosvětově, rollout je postupný.
🔍 Co přesně GPT‑5 přináší? GPT‑5 není jen „větší GPT‑4“. Je to kombinace několika zásadních vylepšení: Jednotný systém + „router“ GPT‑5 je sjednocený systém, který kombinuje rychlý „smart“ model, hlubší „reasoning“ model a router, jenž v reálném čase rozhoduje, co je na daný dotaz nejlepší (a bere v úvahu i to, když napíšeš něco jako „think hard about this“). Po dosažení limitů přepne na „mini“ verzi.
✅ Přesnost a nižší halucinace Méně halucinací v medicíně - Na HealthBench Hard Hallucinations vykazuje gpt‑5‑thinking chybovost 1,6 % (oproti 12,9 % u GPT‑4o a 15,8 % u o3). V urgentních situacích a globálním zdraví jsou prohřešky také dramaticky nižší. Pozor: nejde o univerzální „míru halucinací“, ale o konkrétní vysoce‑rizikovou sadu zdravotnických scénářů.(HealthBench).
Výrazné snížení oproti předchozím modelům.
✅ Kódování a agentní práce
SWE‑bench Verified: 74,9 % (1. pokus). Aider Polyglot (code‑editing): 88 % (SOTA). τ²‑bench (telecom tool‑use): 96,7 %, výrazné zlepšení v řetězení nástrojů a robustnosti. Nejen generování kódu, ale i detekce chyb, plánování, end‑to‑end buildy. Výkonnost potvrzena u běžných technologií (web, backend, databáze). 🔎 Zdroj: OpenAI, TechCrunch
✅ Vědomostní schopnosti OpenAI uvádí SOTA 88,4 % na GPQA (Diamond) u varianty s rozšířeným „thinking“ režimem. (Některá média uvádějí mírně odlišné hodnoty v závislosti na nastavení a „s nástroji“ vs. bez nástrojů.)
GPT-5 89,4 % v testu GPQA (úroveň PhD znalostí). Claude Opus: 80,9 % | Grok 4: 88,9%. 🔎 Zdroj: Axios
✅ Dlouhý kontext GPT‑5 zvládá až 256 000 tokenů bez ztráty přesnosti. V ChatGPT má kontextový limit až 128k tokenů pro Pro/Enterprise, 32k pro Plus/Team a 8k ve Free. Pro API (gpt‑5/mini/nano) uvádí OpenAI 256k jako rozměr kontextu v produktovém přehledu a v developer postu i technický strop až 272k vstupních + 128k výstupních = ~400k celkem (záleží na variantě/model‑card). Prakticky: jde o výrazně delší vstupy i výstupy než dřív.
✅ Adaptivní „routing“ systém Automatické přepínání mezi modely podle typu úlohy (emaily vs. analýzy). 🔎 Zdroj: The Verge
✅Nové vlastnosti pro vývojáře V API přibyly parametry verbosity (krátké vs. dlouhé odpovědi) a reasoning_effort (hloubka přemýšlení), plus custom tools (volání nástrojů i bez striktního JSONu)
🎯 Výsledkem je AI, která lépe chápe záměr, plánuje, vysvětluje a reaguje jako zkušený specialista.
✅Novinky v ChatGPT OpenAI zavedlo v ChatGPT i přednastavené „personality“ (Cynic, Robot, Listener, Nerd). Z uživatelského pohledu má být GPT‑5 „chytřejší, rychlejší a užitečnější“ a postupně se stává výchozím modelem pro všechny uživatele.
💬 Co říkají uživatelé? 🧠 Reakce z komunit (Reddit, early access, vývojáři):
🔹 „Rozdíl mezi GPT‑4 a 5 není vizuálně ohromující. Ale opravuje kód přesně a bez blbostí. To mění hru.“ – u/embeddedwizard
🔹 „Claude 4.1 je stabilnější v rozsáhlých projektech. Ale GPT‑5 rozumí kontextu líp.“ – u/datadevtools
🔹 „GPT‑5 má nejnižší míru halucinací, co jsem kdy viděl.“ – u/ai_benchmark_bot
🔹 „Pamatuje si věci z 10 stránek zpět a použije je elegantně. To je level, co jsme dosud neviděli.“ – u/langchainlover
🧪 Přehled benchmarků Oblast GPT‑5 Claude 4.1 Grok 4 Heavy SWE‑bench (kódování) 74,9 % 74,5 % – GPQA (vědecké znalosti) 89,4 % 80,9 % 88,9 % Humanity’s Last Exam 42 % – 44,4 % HealthBench (halucinace) 1,6 % – –
📚 Zdroj: OpenAI, Reddit /r/singularity, TechCrunch
🚀 Co to znamená pro firmy? GPT‑5 není jen technologická hračka. Pro byznys přináší konkrétní výhody:
🛍️ Automatizace obsahu Popisy produktů, emailové kampaně, landing pages.
Menší chybovost, rychlejší návrh, víc variant.
🧠 Analýza zákaznické zpětné vazby Detekce sentimentu, shrnutí recenzí, návrhy vylepšení.
🧰 Vývoj softwaru Debugging v reálném čase.
Přirozené plánování funkcí – tzv. vibe coding.
Integrace do vývojových nástrojů (např. Cursor, Copilot).
💰Ceny a přístup ChatGPT (spotřebitelsky) Free: GPT‑5 jako výchozí (s limity), kratší kontext. Plus (~$20/měs.): vyšší limity, 32k kontext. Pro (~$200/měs., cena se liší podle regionu; v UK je na stránce £200): přístup k GPT‑5 Pro a 128k kontext, vyšší limity. Team/Enterprise obdobně.
API (vývojáři)
gpt‑5: $1.25/M vstupních tokenů, $10/M výstupních. gpt‑5‑mini: $0.25/M in, $2/M out. gpt‑5‑nano: $0.05/M in, $0.40/M out.
V produktovém přehledu uvádí OpenAI 256k kontext pro tyto řady; viz také detailní developer post k dlouhému kontextu a reasoning výstupům.
💰Co to znamená pro firmy (prakticky)
- Vývoj softwaru: GPT‑5 zvládá plánování, multi‑tool řetězení, opravování chyb a lépe „drží kurz“ i u dlouhých úloh (SWE‑bench 74,9 %; τ²‑bench 96,7 %).
- Integrace v Azure/GitHub Copilot/VS Code je hotová.
- Customer care a agenti: Router + reasoning → nižší cena/latence pro lehké dotazy, „thinking“ pro složité případy.
- Znalostní práce: Delší kontext → lepší práce s dokumenty (reporty, due diligence, rešerše).
- Zdraví/finance: Nižší chybovost na rizikových scénářích (ale stále není náhradou lékaře/poradce)!
💰Jak si GPT‑5 rychle otestovat (tipy do skupiny)
-
Kód → plán → build → test „Navrhni plán migrace na Postgres 16, pak v krocích uprav kód a ukaž diffy i testy. Přemýšlej nahlas (think hard) a používej nástroje postupně.“ (Určit „thinking“ režim a sledovat práci s nástroji.) OpenAI
-
Dlouhý kontext „Zde je 150stránkový dokument (přiložím jako text). Najdi 5 nesrovnalostí, odkaž na strany, navrhni opravy a napiš shrnutí do 300 slov.“ (Prověří vyhledávání „jehly v kupce sena“ u 128k/256k vstupů.)
-
Zdravotnické dotazy (jen informativně!) „Vysvětli rozdíly mezi testy A a B, upozorni, kdy je nutné kontaktovat lékaře a proč.“ (Sleduj, jak model konzervativně flaguje rizika.)
❓ Kontext a objasnění ❔ Co je Humanity’s Last Exam? Pokročilý test, který ověřuje obecnou inteligenci AI skrze otázky z etiky, biologie, historie a logiky – často bez jednoznačných odpovědí.
❔ Výrok Sama Altmana o „jaderné bombě“? Pochází z neveřejného setkání na Stanfordu.
🗯️ „GPT‑5 je tak chytrý, že se ptám: Co jsme to vlastně stvořili?“
💬 Je to metafora, ne poplašná zpráva. Mnozí to kritizují jako marketingový dramatismus. Nicméně to vystihuje rostoucí napětí mezi inovací a regulací. Jde spíš o popis tempa a významu změn než o „poplašnou zprávu“.
🌱 A co udržitelnost? GPT‑5 je extrémně výpočetně náročný.
Denní spotřeba energie odpovídá desítkám tisíc domácností.
Kromě elektřiny je problémem i spotřeba vody na chlazení serverů.
OpenAI říká, že nasazuje systém „routing“, který používá menší modely, kde to stačí.
🎤 Závěrem (osobně) Na GPT‑5 jsem se těšil od chvíle, kdy Altman poprvé naznačil „něco velkého“. A teď je to tu. Možná zatím jen na papíře, ale kvalita a možnosti jsou skutečné.
🔧 Pro developery – nový způsob přemýšlení o kódu. 💡 Pro firmy – méně chyb, rychlejší obsah, chytřejší podpora. 🎨 Pro kreativce – hlubší kontext, lepší jazyk, konzistence.
Bonus: rychlé porovnání (pro grafy/slide)
- SWE‑bench Verified: GPT‑5 74,9 % > Claude 4.1 74,5 % > Gemini 2.5 Pro 59,6 %. (TechCrunch)
- GPQA (Diamond): GPT‑5 Pro 88,4 % (OpenAI).
- HLE (s nástroji): GPT‑5 Pro 42 %, Grok 4 Heavy 44,4 %. (TechCrunch)
- HealthBench Hard Hallucinations: 1,6 % (gpt‑5‑thinking).
Původně publikováno na Facebooku — odkaz na post
Původní zdroj: facebook