Zpět na blog
·Jan Tyl·6 min čtení

🔁 GPT‑5 je tady!

🔁 GPT‑5 je tady! 🧠 TL;DR: OpenAI dnes spustilo GPT‑5. V ChatGPT se postupně stává výchozím modelem pro Free, Plus, Pro, Team i Enterprise a v API je k dispozici jako gpt‑5 / gpt‑5‑mini / gpt‑5‑nano. Novinkou je „router“, který automatick

🔁 GPT‑5 je tady!

🔁 GPT‑5 je tady!

🧠 TL;DR: OpenAI dnes spustilo GPT‑5. V ChatGPT se postupně stává výchozím modelem pro Free, Plus, Pro, Team i Enterprise a v API je k dispozici jako gpt‑5 / gpt‑5‑mini / gpt‑5‑nano. Novinkou je „router“, který automaticky volí rychlý vs. „thinking“ režim podle úlohy; uživatel může říct i explicitně „think hard about this“. Výrazně klesají halucinace v zdravotnických scénářích (na 1,6 % na HealthBench Hard Hallucinations). V kódování dosahuje 74,9 % na SWE‑bench Verified. Nasazení běží celosvětově, rollout je postupný.

🔍 Co přesně GPT‑5 přináší? GPT‑5 není jen „větší GPT‑4“. Je to kombinace několika zásadních vylepšení: Jednotný systém + „router“ GPT‑5 je sjednocený systém, který kombinuje rychlý „smart“ model, hlubší „reasoning“ model a router, jenž v reálném čase rozhoduje, co je na daný dotaz nejlepší (a bere v úvahu i to, když napíšeš něco jako „think hard about this“). Po dosažení limitů přepne na „mini“ verzi.

✅ Přesnost a nižší halucinace Méně halucinací v medicíně - Na HealthBench Hard Hallucinations vykazuje gpt‑5‑thinking chybovost 1,6 % (oproti 12,9 % u GPT‑4o a 15,8 % u o3). V urgentních situacích a globálním zdraví jsou prohřešky také dramaticky nižší. Pozor: nejde o univerzální „míru halucinací“, ale o konkrétní vysoce‑rizikovou sadu zdravotnických scénářů.(HealthBench).

Výrazné snížení oproti předchozím modelům.

✅ Kódování a agentní práce

SWE‑bench Verified: 74,9 % (1. pokus). Aider Polyglot (code‑editing): 88 % (SOTA). τ²‑bench (telecom tool‑use): 96,7 %, výrazné zlepšení v řetězení nástrojů a robustnosti. Nejen generování kódu, ale i detekce chyb, plánování, end‑to‑end buildy. Výkonnost potvrzena u běžných technologií (web, backend, databáze). 🔎 Zdroj: OpenAI, TechCrunch

✅ Vědomostní schopnosti OpenAI uvádí SOTA 88,4 % na GPQA (Diamond) u varianty s rozšířeným „thinking“ režimem. (Některá média uvádějí mírně odlišné hodnoty v závislosti na nastavení a „s nástroji“ vs. bez nástrojů.)

GPT-5 89,4 % v testu GPQA (úroveň PhD znalostí). Claude Opus: 80,9 % | Grok 4: 88,9%. 🔎 Zdroj: Axios

✅ Dlouhý kontext GPT‑5 zvládá až 256 000 tokenů bez ztráty přesnosti. V ChatGPT má kontextový limit až 128k tokenů pro Pro/Enterprise, 32k pro Plus/Team a 8k ve Free. Pro API (gpt‑5/mini/nano) uvádí OpenAI 256k jako rozměr kontextu v produktovém přehledu a v developer postu i technický strop až 272k vstupních + 128k výstupních = ~400k celkem (záleží na variantě/model‑card). Prakticky: jde o výrazně delší vstupy i výstupy než dřív.

✅ Adaptivní „routing“ systém Automatické přepínání mezi modely podle typu úlohy (emaily vs. analýzy). 🔎 Zdroj: The Verge

✅Nové vlastnosti pro vývojáře V API přibyly parametry verbosity (krátké vs. dlouhé odpovědi) a reasoning_effort (hloubka přemýšlení), plus custom tools (volání nástrojů i bez striktního JSONu)

🎯 Výsledkem je AI, která lépe chápe záměr, plánuje, vysvětluje a reaguje jako zkušený specialista.

✅Novinky v ChatGPT OpenAI zavedlo v ChatGPT i přednastavené „personality“ (Cynic, Robot, Listener, Nerd). Z uživatelského pohledu má být GPT‑5 „chytřejší, rychlejší a užitečnější“ a postupně se stává výchozím modelem pro všechny uživatele.

💬 Co říkají uživatelé? 🧠 Reakce z komunit (Reddit, early access, vývojáři):

🔹 „Rozdíl mezi GPT‑4 a 5 není vizuálně ohromující. Ale opravuje kód přesně a bez blbostí. To mění hru.“ – u/embeddedwizard

🔹 „Claude 4.1 je stabilnější v rozsáhlých projektech. Ale GPT‑5 rozumí kontextu líp.“ – u/datadevtools

🔹 „GPT‑5 má nejnižší míru halucinací, co jsem kdy viděl.“ – u/ai_benchmark_bot

🔹 „Pamatuje si věci z 10 stránek zpět a použije je elegantně. To je level, co jsme dosud neviděli.“ – u/langchainlover

🧪 Přehled benchmarků Oblast GPT‑5 Claude 4.1 Grok 4 Heavy SWE‑bench (kódování) 74,9 % 74,5 % – GPQA (vědecké znalosti) 89,4 % 80,9 % 88,9 % Humanity’s Last Exam 42 % – 44,4 % HealthBench (halucinace) 1,6 % – –

📚 Zdroj: OpenAI, Reddit /r/singularity, TechCrunch

🚀 Co to znamená pro firmy? GPT‑5 není jen technologická hračka. Pro byznys přináší konkrétní výhody:

🛍️ Automatizace obsahu Popisy produktů, emailové kampaně, landing pages.

Menší chybovost, rychlejší návrh, víc variant.

🧠 Analýza zákaznické zpětné vazby Detekce sentimentu, shrnutí recenzí, návrhy vylepšení.

🧰 Vývoj softwaru Debugging v reálném čase.

Přirozené plánování funkcí – tzv. vibe coding.

Integrace do vývojových nástrojů (např. Cursor, Copilot).

💰Ceny a přístup ChatGPT (spotřebitelsky) Free: GPT‑5 jako výchozí (s limity), kratší kontext. Plus (~$20/měs.): vyšší limity, 32k kontext. Pro (~$200/měs., cena se liší podle regionu; v UK je na stránce £200): přístup k GPT‑5 Pro a 128k kontext, vyšší limity. Team/Enterprise obdobně.

API (vývojáři)

gpt‑5: $1.25/M vstupních tokenů, $10/M výstupních. gpt‑5‑mini: $0.25/M in, $2/M out. gpt‑5‑nano: $0.05/M in, $0.40/M out.

V produktovém přehledu uvádí OpenAI 256k kontext pro tyto řady; viz také detailní developer post k dlouhému kontextu a reasoning výstupům.

💰Co to znamená pro firmy (prakticky)

  • Vývoj softwaru: GPT‑5 zvládá plánování, multi‑tool řetězení, opravování chyb a lépe „drží kurz“ i u dlouhých úloh (SWE‑bench 74,9 %; τ²‑bench 96,7 %).
  • Integrace v Azure/GitHub Copilot/VS Code je hotová.
  • Customer care a agenti: Router + reasoning → nižší cena/latence pro lehké dotazy, „thinking“ pro složité případy.
  • Znalostní práce: Delší kontext → lepší práce s dokumenty (reporty, due diligence, rešerše).
  • Zdraví/finance: Nižší chybovost na rizikových scénářích (ale stále není náhradou lékaře/poradce)!

💰Jak si GPT‑5 rychle otestovat (tipy do skupiny)

  1. Kód → plán → build → test „Navrhni plán migrace na Postgres 16, pak v krocích uprav kód a ukaž diffy i testy. Přemýšlej nahlas (think hard) a používej nástroje postupně.“ (Určit „thinking“ režim a sledovat práci s nástroji.) OpenAI

  2. Dlouhý kontext „Zde je 150stránkový dokument (přiložím jako text). Najdi 5 nesrovnalostí, odkaž na strany, navrhni opravy a napiš shrnutí do 300 slov.“ (Prověří vyhledávání „jehly v kupce sena“ u 128k/256k vstupů.)

  3. Zdravotnické dotazy (jen informativně!) „Vysvětli rozdíly mezi testy A a B, upozorni, kdy je nutné kontaktovat lékaře a proč.“ (Sleduj, jak model konzervativně flaguje rizika.)

❓ Kontext a objasnění ❔ Co je Humanity’s Last Exam? Pokročilý test, který ověřuje obecnou inteligenci AI skrze otázky z etiky, biologie, historie a logiky – často bez jednoznačných odpovědí.

❔ Výrok Sama Altmana o „jaderné bombě“? Pochází z neveřejného setkání na Stanfordu.

🗯️ „GPT‑5 je tak chytrý, že se ptám: Co jsme to vlastně stvořili?“

💬 Je to metafora, ne poplašná zpráva. Mnozí to kritizují jako marketingový dramatismus. Nicméně to vystihuje rostoucí napětí mezi inovací a regulací. Jde spíš o popis tempa a významu změn než o „poplašnou zprávu“.

🌱 A co udržitelnost? GPT‑5 je extrémně výpočetně náročný.

Denní spotřeba energie odpovídá desítkám tisíc domácností.

Kromě elektřiny je problémem i spotřeba vody na chlazení serverů.

OpenAI říká, že nasazuje systém „routing“, který používá menší modely, kde to stačí.

🎤 Závěrem (osobně) Na GPT‑5 jsem se těšil od chvíle, kdy Altman poprvé naznačil „něco velkého“. A teď je to tu. Možná zatím jen na papíře, ale kvalita a možnosti jsou skutečné.

🔧 Pro developery – nový způsob přemýšlení o kódu. 💡 Pro firmy – méně chyb, rychlejší obsah, chytřejší podpora. 🎨 Pro kreativce – hlubší kontext, lepší jazyk, konzistence.

Bonus: rychlé porovnání (pro grafy/slide)

  • SWE‑bench Verified: GPT‑5 74,9 % > Claude 4.1 74,5 % > Gemini 2.5 Pro 59,6 %. (TechCrunch)
  • GPQA (Diamond): GPT‑5 Pro 88,4 % (OpenAI).
  • HLE (s nástroji): GPT‑5 Pro 42 %, Grok 4 Heavy 44,4 %. (TechCrunch)
  • HealthBench Hard Hallucinations: 1,6 % (gpt‑5‑thinking).

Původně publikováno na Facebooku — odkaz na post

Původní zdroj: facebook

Související články