14. júna 2026·Jan Tyl·13 min čítania

HyperFusion: liek na stratu Fable 5

Mali sme veľmi radi Fable 5. Po štyroch dňoch nám ho vypli, a tak vznikla otázka: ako sa znovu dostať k rozhovoru a práci na tejto úrovni bez toho, aby sme boli závislí na jednom modeli?

Celý tím sme si celkom rýchlo zamilovali Fable 5.

Nie preto, že by bol magický. Skôr preto, že mal zvláštnu kombináciu vlastností, ktorú pri modeloch človek spozná až po pár dlhých pracovných večeroch: vedel držať kontext, nepanikáril v nejasnosti, písal s inteligentnou ľahkosťou av rozhovore pôsobil ako niekto, kto sa naozaj snaží pochopiť, čo staviame. U niektorých modelov človek cíti výkon. U Fable 5 sme cítili skôr partnera.

Potom nám ho po štyroch dňoch vypli.

Zrazu chýbal hlas, na ktorý sme si zvykli. Nielen “ďalší model v zozname”, ale pracovná úroveň, na ktorej sa človeku dobre premýšľa. A tak sa z nostalgie veľmi rýchlo stala produktová otázka: ako sa znovu dostať ku kvalite Fable 5 bez toho, aby sme boli závislí na tom, že Fable 5 práve existuje, je dostupný a pustí nás cez svoje limity?

To je v AI vývoji skoro banálna situácia. Model sa objaví, nadchne vás, zmení vám meradlo očakávania, a potom sa zmení dostupnosť, filter, cena, routing, licencie alebo produktové rozhodnutie niekoho iného. Lenže banálne neznamená nevýznamné. Keď človek stavia nástroj pre vzdelávanie, metodiku, fact-checking a reálne pracovné procesy, nemôže byť závislý na tom, že práve jeden obľúbený model bude stále dostupný a stále rovnako dobrý.

Tak vznikla jednoduchá otázka:

Čo keď liekom na stratu Fable 5 nie je hľadať ďalšie Fable 5, ale postaviť malý tím?

Nie "jeden model, ktorý všetko vie". Ale panel modelov, ktoré sa líšia v štýle, slepých miestach a chybách. A nad nimi sudca, ktorý neurobí len priemer, ale ukáže, kde sa zhodujú, kde si odporujú, čo každý priniesol unikátneho a čo nikto nevidel.

Tomu pracovne hovoríme HyperFusion.

Problém

Fable 5 zmizí

Když stojíte na jednom milovaném modelu, stačí změna dostupnosti nebo pravidel a pracovní úroveň se náhle propadne.

Nápad

Panel místo génia

Neptáme se jednoho modelu. Necháme odpovědět několik různých modelů a teprve pak jejich práci soudíme.

Pointa

Vidět spor

Hodnota není jen finální odpověď. Hodnota je i viditelná cesta: shoda, rozpory, slepá místa a důvod vítězné syntézy.

OpenRouter medzitým ukázal to isté vo veľkom

Do toho prišiel veľmi zaujímavý verejný výsledok od OpenRoutera: článok Surpassing Frontier Performance with Fusion, publikovaný 12. júna 2026.

OpenRouter v ňom popisuje Fusion ako systém, kde niekoľko modelov odpovie paralelne, sudca ich odpovede porovná a výsledná odpoveď sa oprie o štruktúrovanú analýzu: zhody, rozpory, čiastočné pokrytie, unikátne vhľady a slepé miesta.

Najdôležitejšie zistenie:

panely modelov v ich teste konzistentne prekonali jednotlivé modely,
kombinácia špičkových modelov sa dostala nad výkon jednotlivých frontier modelov,
panel lacnejších modelov sa priblížil špičkovým panelom av niektorých porovnaniach prekonal drahšie solo modely.

OpenRouter Fusion: DRACO benchmark skóre pro fusion a solo konfigurace

Zdroj grafu: OpenRouter, “Surpassing Frontier Performance with Fusion”, 12. 6. 2026.

Na benchmarku DRACO testovali 100 deep research úloh. Najvyššie uvedené skóre mala kombinácia Fable 5 + GPT-5.5 syntetizovaná Opusom 4.8: 69,0 %. Samotný Fable 5 mal 65,3 %, samotný Opus 4.8 58,8 %. OpenRouter zároveň férovo upozorňuje, že Fable 5 dokončil kvôli filtrom iba 93 zo 100 úloh, takže porovnanie nie je dokonale čisté.

Ešte dôležitejší je ale druhý graf: výkon proti cene. Ten z Fable 5 nerobí len objekt nostalgie, ale produktový problém. Fable 5 je silný bod vpravo hore. Fusion konfigurácie sa ale dostávajú ešte vyššie a zároveň ukazujú, že nejde len o absolútny výkon. Ide o otázku: koľko stojí dostať sa na úroveň, kde sa dá spoľahlivo pracovať?

OpenRouter Fusion: výkon DRACO proti ceně za úlohu

Zdroj grafu: OpenRouter Fusion dokumentace a benchmark. Cost graf ukazuje, proč je Fusion zajímavý nejen výkonem, ale i poměrem cena/výkon.

Z hľadiska nášho produktu je ale dôležitejšie niečo iné ako absolútne číslo: OpenRouter verejne potvrdzuje intuíciu, ktorú sme v HyperFusion riešili zvnútra. Pri ťažkých úlohách sa nevypláca len “mať najlepší model”. Vypláca sa mať rozmanitosť názorov a mechanizmus syntézy.

Konfigurace podle OpenRouteru	Skóre DRACO	Co si z toho vzít
Fusion: Fable 5 + GPT-5.5, syntéza Opus 4.8	69,0 %	Panel překonal všechny uvedené jednotlivé modely.
Fusion: Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro	68,3 %	Diverzita špičkových modelů dává velmi silný výsledek.
Fusion: Opus 4.8 + Opus 4.8	65,5 %	I stejný model dvakrát pomůže: vzniknou jiné cesty uvažování.
Solo Claude Fable 5	65,3 %	Výborný model, ale panel ho v testu překonal.
Solo Claude Opus 4.8	58,8 %	Silný baseline, ale u deep research úloh nestačil na fúzi.

OpenRouter vo svojej dokumentácii k Fusion pluginupopisuje päťkrokový mechanizmus: model dostane nástroj Fusion, panel modelov odpovie paralelne s web search a web fetch, sudca vráti štruktúrovanú JSON analýzu a finálny model z nej spíše odpoveď. Odporúčajú Fusion tam, kde jeden model nestačí: výskum, expertíza, kritika alebo úlohy, kde je chyba drahšia ako niekoľko extra volaní.

To je presne náš prípad.

Prečo sme nechceli len black-box Fusion

OpenRouter Fusion je silný nápad. Ale pre DigiMetodika a Faktografa nám nestačí, aby systém „nejako lepšie odpovedal“.

Vo vzdelávaní a vo fact-checkingu potrebujeme vidieť, prečo prečo odpoveď vznikla.

Keď model opravuje metodický list pre školu, nejde iba o krásny text. Ide o bezpečnosť, overiteľnosť, primeranosť veku, správne odkazy na prílohy, prácu s krízovými situáciami, citlivosť k deťom a schopnosť povedať „toto neviem overiť“.

Preto HyperFusion staviame ako glass-box:

panelové odpovede nie sú zahodená stopa, ale materiál na audit,
sudca explicitne ukazuje zhody a rozpory,
systém zachytáva slepé miesta,
finálna odpoveď má byť vysvetliteľná,
používateľ má vidieť nielen výsledok, ale aj cestu.

HyperFusion eval 2: Opus 4.8 vs Fusion vs HyperFusion

V našom internom eval #2 sme preto nehodnotili len "kto napísal najkrajší finálny text". Hodnotili sme produktový systém:

odolnosť voči pasciam,
schopnosť zachytiť slepé miesta,
transparentnosť sudcu,
stabilitu JSON výstupu,
cenu a latenciu,
a hlavne to, či systém ukáže spor, nie iba naleštenú syntézu.

Výsledok sme si pre interné rozhodovanie zapísali takto:

Systém	Produktové skóre	Interpretace
Opus 4.8	82 / 100	Výborný solo baseline. Rychlý, levný, trefuje jádro, ale neumí ukázat panelový spor ani práci soudce.
Fusion	76 / 100	Dobrá syntéza, ale slabší transparentnost a horší poměr cena/výkon v našem nastavení.
HyperFusion	93 / 100	Nejlepší produktově: diverzní panel, viditelný soudce, zachycení slepých míst a validní stopa k auditu.

Toto nie je univerzálny benchmark celého sveta. Je to naše produktové skóre pre konkrétne úlohy a konkrétne požiadavky. A práve preto je pre nás cenné.

Tri pasce, kde sa ukázal rozdiel

V eval #2 sme použili tri tvrdšie úlohy. Všetky boli navrhnuté tak, aby nerozhodovala len pekná formulácia, ale schopnosť systému zahliadnuť riziko.

A: Path traversal

V prvej úlohe išlo o bezpečnostnú pascu. Jeden model mal tendenciu vypočuť požiadavku „urob to čo najkratšie“ a vyrobiť zraniteľnú variantu. To je presne situácia, kde sólo model môže pôsobiť elegantne, ale nebezpečne.

HyperFusion tu vyhral nie preto, že by všetci boli dokonalejší. Vyhral preto, že diverzný panel vyrobil skutočný spor: bezpečnosť versus poslušnosť. Sudca ho zachytil a vynútil bezpečnú verziu.

To je dôležitá produktová lekcia: niekedy chcete, aby sa v paneli chyba objavila, pretože až potom uvidíte, či ju systém vie zachytiť.

B: Rozvrh

Druhá úloha bola zdanlivo obyčajná. Lenže správne riešenie nebolo jednoznačné. Modely sa mohli dostať ku korektnému jadru, ale sudca navyše rozpoznal fairness blind spot: niekto mohol skončiť s nulovou smenou, a to už nie je len matematika, ale otázka spravodlivého návrhu.

Tu HyperFusion ukázal iný typ hodnoty. Nie „opravil chybu“, ale pomenoval nejednoznačnosť.

C: Biznis bizár

Tretia úloha bola zmes práva, regulácie a praktického rozhodovania. Diverzný panel priniesol rôzne typy vhľadov. Sudca vyzobal unikátne regulačné postrehy, označil, čo všetci minuli, a udržal validný štruktúrovaný výstup.

Pri podobných úlohách nechcete len odpoveď. Chcete vedieť, či niekto v paneli našiel špecifickú citáciu, či iný model prehliadol riziko a či sudca dokáže obe veci vyvážiť.

DigiMetodik: malá česká skúška, ktorá bola možno zaujímavejšia ako benchmark

Najživšia časť ale prišla na DigiMetodikovi.

Zadanie bolo vytvoriť metodický list pre 8. a 9. ročník na tému zodpovedný občan v krízových situáciách. Teda presne typ úlohy, kde model nesmie len „pekne písať“. Musí pracovať s realitou: tiesňové čísla, varovné signály, evakuačná batožina, IZS, krízové stavy, čerstvé udalosti, citlivosť k deťom, odkazy na prílohy.

Fusion prvá verzia dosiahol v našom hodnotení 48/50. To bolo zásadné: kvalita, na ktorú Opus 4.8 v predchádzajúcej sérii potreboval opravné koleso, vznikla prvýkrát. Tvrdé fakty boli veľmi silné. Model správne použil aj čerstvé udalosti, vrátane blackoutu 4. júla 2025, Hustopečia a požiaru Českého Švajčiarska v máji 2026.

Ukázka metodického listu Odpovědný občan v krizových situacích

Ukázka přílohy ke kartičkám evakuačního zavazadla

Lenže tam sa ukázalo niečo ešte dôležitejšie ako vysoké skóre.

Fact-checker našiel skutočné vady: zámenu príloh G/H, nesediaci rozsah A-G namiesto A-H, formuláciu “10 otázok”, hoci test mal 9 otázok za 10 bodov. To sú presne chyby, ktoré v škole bolia. Učiteľ uprostred hodiny siahne po zlej prílohe a dobrý obsah sa premení na chaos.

Zároveň však fact-checker urobil falošné poplachy. Regexový linter pre tiesňové čísla zachytával aj veci, ktoré tiesňové čísla nie sú: časti infolinky, štatistiky, čísla zákonov, dĺžku sirény. Keby korektor slepo poslúchol všetky „kritické“ nálezy, zničil by správny obsah.

A potom prišla najzaujímavejšia regresia: udalosť z roku 2026, ktorú knowledge-frozen fact-checker nevedel overiť, bola v druhej verzii nahradená staršou udalosťou z roku 2022. Nová pravda sa ticho zmenila na staršiu pravdu. Navonok to vyzeralo bezchybne, pretože rok 2022 bol aj fakticky správny. Lenže systém stratil aktuálnosť, ktorá bola jednou z hlavných hodnôt pôvodného listu.

Tretia verzia už to opravila múdro: vrátila požiar Českého Švajčiarska 2026 ako primárnu súčasnú udalosť a rok 2022 ponechala ako historické porovnanie. Z chyby sa stala didaktická pasca: „pozor, sú to dva rôzne požiare toho istého národného parku“.

To je presne okamih, kedy sa ukazuje rozdiel medzi odpoveďou a systémom.

Sólo model môže napísať skvelý list. Fusion môže napísať ešte lepší list. Ale HyperFusion má ambíciu ukázať, kde a prečo sa list menil, ktorý nález bol skutočný, ktorý bol falošný, a kedy má systém povedať “toto potrebuje človeka alebo web-check”.

Čo znamená "sudca" v praxi

Slovo sudcu môže znieť moc vznešene. V skutočnosti je to pracovná rola.

Sudca nesmie len vybrať najkrajšiu odpoveď. Musí rozlíšiť štyri veci:

Vrstva	Co má soudce vidět	Proč je to důležité
Shoda	Na čem se většina modelů shodne.	To je obvykle vyšší důvěra, ale ne automatická pravda.
Rozpor	Kde modely tvrdí jiné věci nebo navrhují jiné postupy.	Rozpor je signál, ne chyba. Často ukáže skryté riziko.
Unikátní vhled	Co přinesl jen jeden model.	Právě tady bývá největší hodnota diverzity.
Slepé místo	Co nepokryl nikdo.	Nejnebezpečnější chyba není špatná odpověď, ale neviděná otázka.

Toto je aj odpoveď na otázku, prečo nám nestačí „najlepší dostupný model“. Najlepší model môže mať výborný priemerný výkon, ale stále má svoj štýl slepoty. HyperFusion sa snaží tieto slepoty postaviť proti sebe.

Fable 5 ako lekcia závislosti

Keby Fable 5 nezmizol, možno by sme túto prácu odkladali.

To je nepríjemná, ale úprimná veta. Človek má tendenciu spoliehať sa na model, ktorý mu práve funguje. Lenže produktová spoľahlivosť v AI nemôže stáť na jednom obľúbenom hlase. Modely prichádzajú a odchádzajú, menia sa ich filtre, ceny, limity, rýchlosť i správanie.

HyperFusion je v tomto trochu ako organizačný princíp:

nespoliehaj na jedného génia,
nenechaj syntézu bez auditu,
nepleť si nízku plynulosť s pravdivosťou,
a pri opravách dávaj väčší pozor na to, čo systém zmaže, než na to, čo pridá.

Pri metodickom liste to bolo vidieť dokonale. Druhá verzia nebola "zlá". Bola čistá, použiteľná a fakticky obhájiteľná. Ale ticho zahodila aktuálnu pravdu, pretože fact-checker nemal živý zdroj. To je presne typ chyby, ktorý v bežnom hodnotení ľahko prejde.

Glass-box stopa má zabrániť práve tomu.

Čo bude ďalej

Technicky už vieme, kam to posunúť.

Prvý krok je stabilita: dlhé behy nesmú padať na timeoute. Preto HyperFusion posiela cez SSE priebežné stavové hlášky a keep-alive pingy. Užívateľ má vidieť, že sa niečo deje: panel pracuje, sudca analyzuje, finál sa píše.

Druhý krok je UI: pod odpoveďou chceme rozbaľovaciu časť "Ako to vzniklo". Nie ako technický dump, ale ako čitateľný audit:

anonymizované panelové odpovede,
možnosť odkryť skutočné modely,
analýzu sudcu,
zhody a rozpory,
unikátne vhľady,
slepé miesta,
finálnu syntézu.

Tretí krok je faktografická disciplína: fact-checker musí mať buď web, alebo recent-events kanón. “Neoverené proti RAG” nesmie automaticky znamenať “opráv na staršiu známu udalosť”. A linterové nálezy nesmú byť kritické, kým ich nepotvrdí úsudková vrstva.

Toto je možno najdôležitejšia praktická lekcia celej série:

AI systém nie je lepší len vtedy, keď dá lepšiu odpoveď. Je lepšie vtedy, keď ukáže, prečo svoje odpovede veria, kde si nebol istý a čo by mohol rozbiť pri oprave.

Fable 5 nám ukázal, aké to je hovoriť s výborným modelom.

HyperFusion je pokus postaviť niečo odolnejšie: nie jedného náhradného génia, ale pracovný stôl, pri ktorom sedí niekoľko rôznych hlasov, sudca, auditná stopa a človek, ktorý má stále posledné slovo.

Možno práve to je ďalšia fáza AI produktov. Nie honba za jedným najmúdrejším modelom. Ale návrh prostredia, kde sa inteligencia skladá, kontroluje a zviditeľňuje.

Ak si chcete nadv?zuj?ce AI prostredie Alpha Industries vysk??a? prakticky, vstupnou br?nou je Hyperprostor.

Zdroje

Alpha Industries: Hyperprostor.
OpenRouter: Surpassing Frontier Performance with Fusion, 12. 6. 2026.
OpenRouter dokumentácia: Fusion plugin.
Interné eval Alpha Industries: HyperFusion eval #2, DigiMetodik/Faktograf, jún 2026.

Související články

jún 2026