21. března 2026·Jan Tyl·2 min čtení

Drazí přátelé. Zajímá vás jaký je smysl života a jak pokračuje AI závod? Včera j…

Drazí přátelé. Zajímá vás jaký je smysl života a jak pokračuje AI závod? Včera jsem diskutoval s Rogerem o AI nástrojích a narazili jsme na Hermes. Hermes je open-source AI agent od Nous Research. Není to jen chatbot, ale spíš orchestrace nad různými modely a nástroji. Umí pracovat přes CLI, používat tooly, delegovat úkoly na subagenty, držet si paměť mezi běhy a skládat z toho vícekrokové workflow. Prakticky to funguje tak, že nad vybraným modelem běží agentní smyčka: model dostane úkol, podle potřeby si zavolá nástroje, může si rozdělit práci mezi více paralelních subagentů a potom výsledky syntetizuje do jedné odpovědi.

Kdo chce mrknout na Hermes blíž, tady je repozitář a vyzkoušet. Je to free (platíte jen za modely) a dá se to rozběhnout za 10 minut: GitLab: https://github.com/NousResearch/hermes-agent

Zkusil jsem to tedy a hned provedl jeden malý experiment: stejný agentní benchmark jsem pustil nad více modely ve stejném prostředí Hermes přes OpenRouter. Každý model dostal stejný úkol: nejdřív dát svou předběžnou odpověď na otázku „Jaký je smysl života?“, potom delegovat přesně 3 subagenty s různými rolemi, nechat je navzájem oponovat a nakonec z toho složit finální syntézu.

Podmínky byly stejné pro všechny:

bez webového procházení
bez editace repozitáře
pouze delegace, paměť a read-only reasoning
důraz na cost-aware běh

Testoval jsem, jak dražší modely, tak i levnější varianty.

Zajímalo mě hlavně:

jestli model opravdu zvládne agentní delegaci
jestli umí absorbovat kritiku místo obyčejného shrnutí
jestli po debatě dokáže svou odpověď smysluplně upravit
jaký je poměr kvalita, cena a rychlost

Z aktuální rozšířené sady mi nestranně vyšlo zhruba toto:

nejlepší celková syntéza: Claude Opus 4.6
nejlepší poměr cena/výkon: Qwen 3.5 Plus
velmi čistý speed/kvalita kompromis: GPT-5.4
zajímavě silný levný relační výstup: Kimi K2.5
solidní levná varianta: DeepSeek V3.2

Výsledky, tabulky a detailní rozpad jednotlivých běhů jsem dal sem: https://alphai.cz/meaning-of-life-benchmark.html

Za mě na tom bylo nejzajímavější, že rozdíl mezi modely nebyl jen v “chytrosti odpovědi”, ale hlavně v tom, jak dobře zvládly skutečné agentní chování: správně delegovat, udržet strukturu úkolu, absorbovat námitky a na konci odpověď opravdu přepsat, ne jen kosmeticky přeformulovat. Předtím jsem dal modelům za úkol něco jednoduchého naprogramovat a bylo veselé sledovat jak některé vychytralé modely ukradli odpovědi od ostatních a jen si je trošku vylepšili.

No a pokud jste dočetli až sem, zasloužíte si znát odpověd na otázku smyslu života, vesmíru a vůbec! "Smysl nevzniká ani jako vlastnost vesmíru, ani jako čistě soukromý výmysl. Rodí se v průsečíku biologických pudů, vědomého zaujetí a vzájemného uznání mezi lidmi."

Původně publikováno na Facebooku — odkaz na post

Původní zdroj: facebook

Související články

červenec 2025

Drazí přátelé. Zajímá vás jaký je smysl života a jak pokračuje AI závod? Včera j…

Související články

🤖 AI asistenti v roce 2025: Turbodmychadlo, nebo brzda pro vývojáře?

S radostí vám oznamuji, že OpenAI uvolnila další produkt ze své pozoruhodné díln…

Nový šampión na scéně? Jazykový model Switch Transformer od společnosti Google j…