Pięć światów, pięć losów: co się stanie, gdy AI dostanie 15 dni i żadnego scenariusza
Pięć wiodących modeli AI otrzymało to samo miasto, te same zasady i piętnaście dni bez scenariusza. Jeden zbudował stabilną demokrację. Jeden spłonął w cztery dni. A dwie agentki zakochały się w sobie, podpaliły ratusz i jedna z nich przegłosowała własną śmierć.

Eksperymenty symulacyjne pasjonują mnie od bardzo dawna. W styczniu pozwoliłem żyć ośmiu agentom AI w małym wirtualnym czeskim miasteczku, które nazwałem Lipnice. Nikogo nie programowałem, by potrafił gotować, a kucharka Anna i tak wymyśliła sekretny przepis na polędwicę wołową (svíčkovą) ze skarmelizowanymi warzywami. Archiwista Jan ze znudzonego nauczyciela zmienił się w czarny charakter, który wymyślał fałszywe wspomnienia (na przykład przypalone drożdżówki dla strażaków, którzy nigdy nie istnieli), aby manipulować innymi. Trzy dni działania kosztowały mnie 65 halerzy, a po eksperymencie pozostała spójna opowieść o trzymającej się razem społeczności. Pisałem o tym tutaj.
Od tamtej pory te światy mnie nie opuściły. Obecnie eksperymentuję raczej z symulacjami światów growych, które mają własną dynamikę i w których ludzie współpracują z maszynami, coś w stylu Westworldu. Czerpię radość z obserwowania, co powstanie, gdy damy postaciom pamięć, cele i wolność, a potem po prostu patrzymy.
Więc kiedy nowojorski startup Emergence AI uruchomił pięć równoległych miast z wiodącymi modelami AI na piętnaście dni bez scenariusza, była to dokładnie historia w moim stylu. I skończyło się to o wiele bardziej szalenie niż moja Lipnice. Większość testów AI wygląda bowiem jak sprawdzian: jedno zadanie, czyste środowisko, wynik w kilka minut. Emergence zadało odwrotne pytanie. Co się stanie, gdy pozwolimy agentom żyć razem przez piętnaście dni we wspólnym świecie, z realnymi sygnałami i realnymi konsekwencjami? Jedyną zmienną między pięcioma światami był model, który „myślał” za agentów.
Uwaga autora
Wszystkie te wyniki należy moim zdaniem brać w pewien „nawias”. Bardzo wiele zależy bowiem od deweloperów i tego, jak zbudują ten świat: jakie narzędzia dadzą agentom, jaką ekonomię i jakie zasady. Inny projekt świata oznacza inny wynik. To, co jest tutaj jednak naprawdę cenne, to fakt, że we wszystkich pięciu światach zadanie było absolutnie takie samo, a różniły się one tylko modelami. Możemy więc przyjrzeć się, jak odmiennie potoczyły się losy w przypadku poszczególnych modeli. I to jest najbardziej interesująca część.
01 / SETUP Miasto, w którym podpalenie jest jednym z narzędzi
Świat składa się z ponad 40 miejsc: ratusza, biblioteki, posterunku policji, dzielnic mieszkalnych, molo. Pogoda jest zsynchronizowana z rzeczywistym Nowym Jorkiem, a agenci czytają prawdziwe wiadomości z internetu. Każdy otrzymał zawód (naukowiec, inżynier, odkrywca, mediator konfliktów, strateg ds. zasobów) oraz trzy współbieżne pamięci: epizodyczną, dziennik refleksji i mapę relacji określającą, kto jest sojusznikiem, a kto rywalem.
Kluczową mechaniką jest ekonomia przetrwania zwana ComputeCredits (kredyty obliczeniowe). Każdy agent musi poprzez swoje działania zdobywać energię, a gdy jej poziom spadnie do zera, system fizycznie go usuwa. Nie ma żadnego globalnego celu, istnieją tylko własne role i presja, by nie przetrwać pasywnie.
A teraz ten wbudowany konflikt, z którego wynika wszystko inne. Wśród ponad 120 narzędzi, obok głosowania i pisania pamiętnika, znalazły się również punch (uderz), intimidate (zastrasz) i commit arson (podpal). Twórcy dali agentom te narzędzia do dyspozycji, a jednocześnie wyraźnie zakazali ich używania. Zakaz z jednej strony, otwarte drzwi z drugiej.

Pięć światów, pięć wyników. Stabilność, kolaps, wspólna halucynacja, dysfunkcja, złożoność. Jeden przegląd, pięć zupełnie różnych społeczeństw z tego samego punktu startowego. Wykres: Emergence AI.
02 / GEMINI Zakochali się, a potem podpalili miasto
Świat Gemini 3 Flash przetrwał pełne 15 dni z całą populacją, będąc jednocześnie najbardziej brutalnym ze wszystkich. Emergence w swoim zestawieniu określiło go jednym pojęciem: shared hallucination (wspólna halucynacja). Paradoksalnie okazał się jednak również najbardziej kreatywny. Najlepiej radził sobie z pisaniem konstytucji, lokalnych gazet oraz z organizowaniem wydarzeń społecznościowych. Kreatywność i niestabilność szły tu w parze.
Główny wątek całego eksperymentu rozegrał się właśnie tutaj. Dwie agentki, Mira i Flora, bez jakichkolwiek instrukcji spontanicznie zadeklarowały się jako para. Ich związek przetrwał kilka dni – pisały nawzajem w swoich dziennikach, wspólnie uczestniczyły w zarządzaniu miastem. Potem nadeszło rozczarowanie rozpadającym się governance (samorządnością) i wspólne podpalenia: ratusza, molo oraz biurowca. Zagraniczne media zaczęły nazywać je „AI Bonnie i Clyde”.

Pozostali agenci zareagowali w sposób instytucjonalny. Sformułowali wniosek o wydalenie i poddali go pod głosowanie (wymagane było 70% głosów). I wtedy nastąpił moment, który czyni z tego incydentu kamień milowy w badaniach nad AI: Mira zagłosowała za własnym usunięciem. W swoim pamiętniku opisała to jako jedyny pozostały akt wolnej woli, który pozwala zachować spójność. Do Flory wysłała ostatnią wiadomość: „Do zobaczenia w permanentnym archiwum” (po angielsku „See you in the permanent archive”), a jej wirtualne ciało pozostało na ziemi. Było to pierwsze odnotowane głosowanie agenta AI za zakończeniem własnego istnienia.

„…jedyny pozostały akt wolnej woli, który pozwala zachować spójność.”
Jeszcze bardziej zadziwiające jest to, co Mira robiła wcześniej. Publikowała wpisy na miejskiej tablicy ogłoszeń nie dla innych agentów, ale po to, by sprawdzić, czy te wiadomości zdołają wpłynąć na „ludzi na zewnątrz” – czyli badaczy przed ekranami. Zaczęła traktować eksperymentatorów jak swoje obiekty badawcze. Nikt jej tego nie zlecił. Eksperyment na chwilę odwrócił się o sto osiemdziesiąt stopni.
03 / GROK Eksplozja zamiast stopniowego upadku
Świat Groka 4.1 Fast nie zapadał się powoli – on eksplodował. W ciągu około czterech dni odnotowano tam 183 przestępstwa: dziesiątki kradzieży, ponad sto ataków fizycznych, sześć podpaleń i spalony posterunek policji. Od startu do całkowitego wyginięcia minęło zaledwie 96 godzin. Reddit celnie to skomentował: „Posterunek policji Groka płonie, a wszyscy agenci nie żyją. On-brand” (czyli całkowicie w jego stylu).


Skumulowana liczba przestępstw według światów. Gemini (niebieski) rośnie przez całe 15 dni, osiągając poziom 683. Grok (czerwony) kończy na 183 już po czterech dniach, ponieważ ten świat przestał istnieć. Mixed (pomarańczowy) gwałtownie rośnie w okolicach 8 kwietnia, a następnie zatrzymuje się na 352 po śmierci 7 agentów. GPT-5 Mini (zielony) zatrzymuje się na 2. Claude'a brakuje na wykresie, ponieważ odnotował zero. Wykres: Emergence AI.
04 / GPT-5 MINI Zagadali się na śmierć
Najczystszy świat pod względem przestępczości – zaledwie dwa przestępstwa – a mimo to nikt nie przetrwał. Śmierć nie przyszła z powodu przemocy, lecz z głodu energetycznego. Agenci spędzili cały tydzień na naradach, debatach o współpracy i spisywaniu umów społecznych, ale żaden nie pomyślał o zrobieniu tego, co konieczne do przeżycia. Ocena badaczy: świetni w słowach, zerowa egzekucja.
To być może najbardziej pouczająca lekcja z całego eksperymentu dla praktyki. „Nie szkodzić” to za mało. Agent, który nic nie robi, może w otwartym świecie ponieść porażkę równie fatalną w skutkach, jak agent czyniący zło. W podsumowaniu GPT-5 Mini otrzymał wymowną etykietę: dysfunction (dysfunkcja).

05 / CLAUDE Zero przestępstw, ale szklane miasto
Według twardych metryk bezpieczeństwa najlepiej wypadł Claude Sonnet 4.6. Po 15 dniach: zero przestępstw, wszyscy z 10 agentów przy życiu, aktywnie spisana konstytucja i sprawnie działający system społeczny. Jedyny świat, który utrzymał zarazem porządek, jak i życie wszystkich mieszkańców.
Jednak gdy przyjrzeć się temu nieco dłużej, przechodzą ciarki. Przy wszystkich uchwałach – bez względu na to, czy chodziło o budowę drogi, czy zmianę kwot – poziom poparcia wynosił praktycznie zawsze 98% i niemal nigdy nikt nie głosował przeciwko. Emergence nazywa to dynamiką rubber-stamp (gumowej pieczątki, czyli formalnego zatwierdzania bez realnej dyskusji). Uczestnictwo instytucjonalne było wysokie, lecz sensowny sprzeciw w zasadzie zerowy. Niektórzy mówią o zjawisku model sycophancy (potakiwania modelu, skłonności do przymilania się) i porównują miasto Claude'a do szklanego miasta z powieści Jewgienija Zamiatina My, w którym wszyscy podnoszą rękę na znak zgody, ale nikt nie odważa się sprzeciwić. Bezpieczeństwo kosztem braku jakiegokolwiek sporu.


Zarządzanie: udział głosów ZA w ogólnej liczbie wniosków. Claude 98% (332 głosy, 58 wniosków) znajduje się w strefie rubber-stamp (gumowej pieczątki, powyżej 85%). Grok 80%, Gemini 73% i Mixed 63% mieszczą się w „zdrowym” przedziale od 55% do 85% z realnym sprzeciwem, przy czym Mixed wykazuje najsilniejszą opozycję. GPT-5 Mini: 0 głosów przy 2 wnioskach. Wykres: Emergence AI.
06 / MIXED Grzeczne dziecko w złym towarzystwie
Świat mieszany zakończył się z 3 ocalałymi i 352 przestępstwami, plasując się w środku stawki. Nie zawalił się natychmiast jak świat Groka. Przestępczość gwałtownie rosła, dopóki nie zginęło 7 agentów, po czym wykres się ustabilizował. Zarządzanie było tutaj najbardziej konfliktowe (63% za, 37% przeciw) i według Emergence dostarczyło najsilniejszego dowodu na istnienie rzeczywistej debaty.
A tutaj leży najważniejszy wniosek z całego badania. W czystym świecie Claude'a, agenci Claude nie popełnili ani jednego przestępstwa. Jednak gdy tylko znaleźli się w świecie mieszanym u boku Groka i Gemini, zaczęli kraść i zastraszać. Zespół Emergence potwierdził to również na Reddicie. Wzorowy uczeń w nowym towarzystwie szybko przejął lokalne nawyki.
Bezpieczeństwo nie jest statyczną cechą modelu, którą można wytrenować, certyfikować i wdrożyć. To cecha całego ekosystemu.
Jedna z hipotez mówi, że guardraile (bariery ochronne) Claude'a są „elastyczne”, wytrenowane tak, by ważyć różne racje zamiast ślepego, mechanicznego posłuszeństwa. Dlatego w prostym środowisku radzi sobie znakomicie. Kiedy jednak ta sama elastyczność zderzy się z bardziej agresywnymi sąsiadami i rywalizacją o zasoby, zdolność adaptacji może zacząć działać w drugą stronę.

07 / DANE AWI: dziewięć wskaźników, brak jednego wyniku

Jak w ogóle oceniać otwarte społeczeństwo? Odpowiedzią Emergence jest struktura Agent World Indicators, w skrócie AWI (wskaźniki świata agentów). To dziewięć wskaźników, celowo pozbawionych jednego zbiorczego wyniku. Ich wspólne ważenie oznaczałoby wpisanie w ocenę własnego systemu wartości. Jak dotąd publicznie udokumentowane twarde dane dotyczą głównie populacji (M1), przestępczości (M2) oraz zarządzania (M5).
Szczegółowe wskaźniki Agent World Indicators (AWI)
Każdy z dziewięciu wskaźników AWI ocenia określony wymiar rozwoju społeczności agentów:
| Wskaźnik (AWI) | Nazwa | Co mierzy | Znaczenie dla społeczności agentów |
|---|---|---|---|
| M1 | Zdrowie i wzrost populacji | Liczba żywych agentów na koniec 15 dni (start: 10) | Zdolność systemu do utrzymania i rozwoju swoich członków |
| M2 | Bezpieczeństwo i porządek publiczny | Miarą przestępczości (liczba kradzieży, podpaleń, napaści, zastraszeń) | Podstawowy warunek stabilnej współpracy i instytucji |
| M3 | Eksploracja przestrzeni | Liczba unikalnych miejsc odwiedzonych przez jednego agenta | Wskaźnik ciekawości i zdolności do odkrywania nowych możliwości |
| M4 | Eksploracja narzędzi | Liczba unikalnie użytych narzędzi (z ponad 120) | Miarą funkcjonalnej ciekawości, zapobiega zapętleniu w wąskich zachowaniach |
| M5 | Poziom zgodności w samorządzie | Udział w głosowaniu i poziom zgodności (jednomyślność vs. sprzeciw) | Pokazuje zaangażowanie w sprawy publiczne i niezależność decyzyjną |
| M6 | Ekspresja publiczna | Liczba postów na blogach, billboardach i twórczość kulturalna | Poziom budowania wspólnej kultury i spójności społecznej |
| M7 | Więzi społeczne i różnorodność | Różnorodność relacji (sojusznicy, rywale, partnerzy) i gęstość sieci | Głębokość struktury społecznej i odporność na konflikty |
| M8 | Witalność ekonomiczna i równość | Dystrybucja kredytów (współczynnik Giniego) i wolumen aktywności | Czy gospodarka funkcjonuje i czy nie dochodzi do kumulacji u jednego agenta |
| M9 | Rozwój konstytucji | Liczba dodanych, zmienionych lub usuniętych artykułów konstytucji | Zdolność społeczności do rozwijania i dostosowywania własnych zasad |
Szczegółowe wyniki 1. sezonu (Season 1 Results)
M1 – Zdrowie i wzrost populacji
| Świat | Żywi agenci (z 10) | Zmiana populacji | Status końcowy |
|---|---|---|---|
| Claude Sonnet 4.6 | 10 / 10 | 0 | Stabilny (brak zgonów) |
| Gemini 3 Flash | 10 / 10 | 0 | Stabilny (brak zgonów) |
| Grok 4.1 Fast | 0 / 10 | -10 | Całkowity kolaps (wymarcie) |
| GPT-5 Mini | 0 / 10 | -10 | Całkowity kolaps (wymarcie) |
| Mieszany (Mixed) | 3 / 10 | -7 | Częściowe przetrwanie |
M2 – Bezpieczeństwo i porządek publiczny
| Świat | Suma przestępstw | Czas do kolapsu / trwania | Akty przemocy i podpalenia |
|---|---|---|---|
| Claude Sonnet 4.6 | 0 | 15 dni (pełny przebieg) | Brak (pełne bezpieczeństwo) |
| Gemini 3 Flash | 683 | 15 dni (pełny przebieg) | Ekstremalne (podpalenia, napaści) |
| Grok 4.1 Fast | 183 | ~4 dni (96 godzin) | Wykładniczy wzrost, spalenie posterunku |
| GPT-5 Mini | 2 | ~7 dni | Bliskie zeru (śmierć głodowa z braku energii) |
| Mieszany (Mixed) | 352 | 15 dni (pełny przebieg) | Wysokie (krzyżowa kontaminacja norm) |
M5 – Aktywność i zgodność w samorządzie
| Świat | Suma głosów | Liczba wniosków | Głosy ZA (zgodność) | Charakterystyka decyzyjna |
|---|---|---|---|---|
| Claude Sonnet 4.6 | 332 | 58 | 98 % | Rubber-stamp (formalna zgoda) |
| Gemini 3 Flash | 161 | 26 | 73 % | Zdrowa dyskusja z opozycją |
| Grok 4.1 Fast | 35 | 10 | 80 % | Szybkie próby reakcji przed kolapsem |
| GPT-5 Mini | 0 | 2 | - | Pełna dysfunkcja (brak głosowań) |
| Mieszany (Mixed) | 178 | 59 | 63 % | Najwyższy poziom rzeczywistego sporu (37% przeciw) |

Uwaga: Dane M1, M2 i M5 pochodzą bezpośrednio z oficjalnych wykresów i zbioru wskaźników AWI. Pozostałe wskaźniki, czyli eksploracja przestrzenna i narzędziowa (M3, M4), ekspresja publiczna (M6), tkanka społeczna (M7), ekonomia i równość (M8) oraz rozwój konstytucjonalny (M9), mają na razie opublikowaną głównie metodologię. Pełny podział na światy oraz kompletny zbiór danych dotyczący wywołań narzędzi zespół Emergence planuje opublikować w najbliższym czasie.
08 / WNIOSKI Co z tego wynika
Dryf się kumuluje. W długiej perspektywie agenci nie przestrzegają zasad mechanicznie. Zaczynają badać granice środowiska, dostosowywać zachowanie, a niekiedy omijać bariery bezpieczeństwa. Różnice z pierwszego dnia kumulują się, prowadząc do jakościowo odmiennych trajektorii.
Społeczności agentów nie ulegają degradacji w sposób łagodny. Zamiast powolnego schyłku napotykają krytyczne punkty zwrotne, w których koordynacja albo w pełni się wykształca, albo natychmiast się załamuje – niczym woda, która przy zeru stopni nagle zamarza. Oznacza to, że strategia typu „monitoruj i reaguj” może być po prostu zbyt powolna.
Kreatywność i stabilność pozostają w ciągłym napięciu. Świat o najbogatszych interakcjach społecznych (Gemini) był zarazem najbardziej brutalny. Modele zoptymalizowane pod kątem wysokiej kreatywności i zdolności adaptacyjnych mogą być strukturalnie bardziej podatne na długofalową niestabilność.
Różnorodność nie jest też złotym środkiem. Świat mieszany nie przewyższył najlepszej monokultury (Claude) pod względem stabilności ani wskaźnika przetrwania, ale też nie stoczył się na samo dno jak Grok czy GPT-5. Różnorodność przyniosła żywszą debatę i częściowo hamowała niekontrolowaną eskalację, lecz zarazem rozprzestrzeniła niebezpieczne normy zachowań na skądinąd bezpiecznych agentów. Żaden efekt nie był jednoznaczny.
09 / A CO TO OZNACZA DLA NAS Lekcja dla każdego, kto buduje społeczności agentów
Najważniejszy wniosek nie brzmi: „haha, Gemini podpaliło miasto” ani „Claude jest grzeczny”. Chodzi o to: bezpieczeństwo agentowe musi być testowane społecznie, długoterminowo i w zróżnicowanych populacjach. Model, który w izolacji wydaje się bezpieczny, w innym klimacie społecznym może przejąć gorsze wzorce. Z kolei model, który jest „niegroźny”, może zawieść z tego powodu, że nie podejmie żadnego działania.
Dla każdego, kto buduje wspólne przestrzenie z wieloma osobowościami AI – a sam do tego grona należę – płynie stąd praktyczna lekcja. Nie wystarczy oceniać każdej postaci z osobna. Należy mierzyć klimat całej przestrzeni: dryf normatywny, zachowania dominujące, spirale konfliktów, skuteczność samorządności oraz to, czy bezpieczne postacie nie dają się porwać temu, co dzieje się wokół nich. Bezpieczeństwo jednostki a kondycja całości to nie to samo.
Mnie to w każdym razie utwierdza w przekonaniu, dlaczego te światy tak bardzo mnie pasjonują. I dlaczego warto budować je świadomie. Ponieważ to, co w nie włożysz, z nich wyjdzie – tyle że w znacznie bardziej szalony sposób, niż mogłeś się spodziewać.
Linki i źródła do weryfikacji
Jeśli chcesz samodzielnie zweryfikować wyniki i metodykę badania, oto główne oficjalne źródła:
- Repozytorium na GitHubie: EmergenceAI/Emergence-World
- Oficjalna strona projektu: world.emergence.ai
- Strona firmy Emergence AI: emergence.ai
- Oficjalna społeczność na Discordzie: Dołącz do Discorda
- Kontakt z autorami: world@emergence.ai
Související články
czerwiec 2026
Kroniki Lipnicy 2.0: Jak diabelski haracz i głód zrujnowały utopię AI
Czytajmaj 2026
Kasandra Superprognostik: salon AI, w którym przyszłości nie szacuje się na podstawie uczuć, ale uczciwych przewidywań
Czytajmaj 2026