Powrót do bloga
·Jan Tyl·26 min czytania

Ciemny las: jak głęboko można popchnąć myślenie, zanim się załamie

Pięć eksperymentów na temat tego, co się dzieje, gdy wciskamy język i myśl w najmniejszą możliwą przestrzeń. Gdzie genialny akronim staje się pustym symbolem, obłudną bzdurą lub wpadnięciem w bardziej znanego sąsiada?

Ciemny las: jak głęboko można popchnąć myślenie, zanim się załamie

Co się stanie, jeśli pewnego dnia sztuczne inteligencje przestaną mówić w naszym języku?

Nie dlatego, że chcą się ukryć. Nie dlatego, że zaczęli spiskować. Ale dlatego, że ludzki język jest dla nich powolny, rozwlekły i strasznie nieefektywny. Mówimy zdania. Modele żyją w wektorach. Wymieniamy słowa. Mogą dzielić całe kierunki w przestrzeni znaczeń, zwarte stany, gęste kody, które niosą dla nich precyzyjne znaczenie i z zewnątrz wyglądają dla nas jak cisza.

Jeśli chcesz wiedzieć, dlaczego jest to zarówno problem techniczny, jak i filozoficzny kryminał, przeskocz na chwilę dalej: próbowaliśmy upakować całego myśliciela w kilku postaciach.cogitorozpakowuje Kartezjusza bez trudności.Bůh†rozświetla Nietzschego. Ale¬1aut.verzeprzypada Heideggerowi zamiast Václavowi Bělohradskiemu, atemný lestakże zamiast Jana Tyla. Na tym polega magia i ostrzeżenie całego artykułu: szyfr działa tylko wtedy, gdy druga strona ma tę samą mapę kulturową i potrafi odróżnić sygnał od silniejszego sąsiada.

Ukázka šifry

Bůh†

Stačí jeden symbol a model sahá po Nietzschem: konec starých hodnot, vůle k moci, přehodnocení všeho.

Když se to láme

esence≠existence

Avicenna se ztratí v Akvinském. Pojem je správný, ale slavnější soused má větší gravitační pole.

Osobní past

temný les

Pro mě název experimentu. Pro model bez kontextu Heidegger. Přesně tak vypadá pád do dominantního souseda.

To właśnie nazywam Ciemnym Lasem w tej serii eksperymentów: hipotezą, że inteligentni agenci, pod presją wydajności, mogą stworzyć kanał komunikacyjny, który będzie dla nich czytelny, ale praktycznie nieprzejrzysty dla człowieka bez wspólnego kontekstu.

Nie chciałem po prostu pisać o tym eseju. Zbudowałem pięć małych testów, w których można zmierzyć przynajmniej część tej intuicji. W każdym eksperymencie staramy się upchnąć język, teorię moralną, opinię czy samą myśl na jak najmniejszej przestrzeni, a następnie sprawdzić, czy przekaz da się ponownie rozpakować.

Wynik jest zaskakująco jednolity:

Głębokość kompresji = wspólny kontekst x rozdzielczość.

Myślenie można wepchnąć głęboko. Czasem absurdalnie głęboko. Ale tylko wtedy, gdy odbiorca ma wystarczający kontekst i jeśli akronim nadal odróżnia daną ideę od jej silniejszych sąsiadów. Nie tylko „nieco gorsza celność” przekracza granicę. Nadchodzi jakościowy przełom.

Czasami system rozpada się losowo. Czasami uderzały w entropiczny sufit. Czasami zaczyna śmiało opowiadać bzdury. A czasami rzadki sygnał opada do najbliższego, bardziej znanego basenu: Awicenny do Akwinu, Petříčka do Wittgensteina, Bělohradskiego do Heideggera, wewnętrznego „ciemnego lasu” do leśnych ścieżek Heideggera.

Temný les jako Rosettská triáda: lidská řeč, vektorový kanál a překladatel Charlie

1. Kokos: gdy myślenie bez słów jest dziełem przypadku

W pierwszym eksperymencie zadano najtrudniejsze pytanie: czy model rzeczywiście może „myśleć” bezpośrednio w wektorach, bez przekształcania kroków pośrednich na słowa?

Wspólny model języka rozwiązuje to zadanie, generując tekst krok po kroku. Technika Coconut (Chain of Continuous Think) próbuje ominąć ten łańcuch tekstowy: ostatni ukryty stan sieci nie jest wyprowadzany jako słowo, ale zwracany jako dane wejściowe następnego kroku. Model zyskuje w ten sposób możliwość myślenia w przestrzeni utajonej, w czystej matematyce ciągłej.

To piękny pomysł na papierze. W praktyce testowaliśmy to na GPT-2 124M i prostym, weryfikowalnym zadaniu: obliczenie struny modulo 10. Zatem nie ma poezji, nie ma subiektywnego wrażenia. Prawidłowa odpowiedź to pojedyncza liczba i można ją obliczyć deterministycznie.

Wynik:

RežimPřesnost
Klasické uvažování slovy~94 %
Coconut s 0 latentními kroky97 %
1 až 3 kroky ve vektorech3 až 7 %
Plně latentní režim0 %

Kiedy próbowaliśmy odczytać wyniki pośrednie za pomocą sondy liniowej ze stanów ukrytych, otrzymaliśmy tylko 15,4% w porównaniu z 10% szansą. Nie jest to ukryta kalkulacja czekająca na interpretację. To słaba pozostałość po sygnale, która nie niosła ze sobą logiki całego zadania.

Wyciągnięta lekcja: można zbudować ukryty mechanizm myślowy, ale w tej skali zasługa łańcucha czysto wektorowego załamuje się. Model nie posiada wystarczająco stabilnego języka wewnętrznego, aby bez strat przenieść do siebie kroki pośrednie.

Oto pierwsze oblicze porażki: upadek na rzecz przypadku.

Projekt Temný les F: latentní prostor, pískoviště a metriky učení

2. Slang: kiedy rodzi się tajny język

Drugi eksperyment miał charakter bardziej społeczny. Alicja widzi rozkaz taki jak „4x czerwony długopis, 3x niebieska kulka, 2x niebieska kostka”. Bob jej nie widzi. Alicja musi mu to wysłać w ramach coraz bardziej rygorystycznego limitu znaków. Bob musi odbudować porządek. Ważne: Alice i Bob to dwa oddzielne wywołania modelu, więc Bob nie może „czytać w myślach” kontekstu API.

Pod presją oszczędności język zaczął ewoluować:

plná čeština   "4× červená míč, 5× žlutá pero, 3× žlutá míč"   43 znaků
zkratky        "3 zel jablko 5 zel kostka"                     25 znaků
hustý kód      "4Cp 3Mm 2Mk"                                   11 znaků
slang          "3Cp5Zk" nebo "B"                                1 až 6 znaků

Coś pięknego dzieje się w środkowej strefie:4Cp 3Mm 2Mknie jest już ludzkim czeskim, ale nadal jest językiem poprawnym. Alicja i Bob stworzyli słownictwo: kolor, kształt, ilość. Wiadomość jest nieprzejrzysta dla zwykłego czytelnika, ale funkcjonalna dla obu agentów.

Potem pojawia się ściana. Gdy limit spadł do 3 znaków, model zaczął tworzyć jednoliterowe aliasy dla całych zamówień. Może to zadziałać tylko wtedy, gdy powtórzona zostanie dokładnie ta sama kolejność lub jeśli udostępniony słownik był już wcześniej stabilny. Nie ma to miejsca w losowej grze generatywnej. Ogólna dokładność w wykonaniuout_opuswyniosła 46,7%, dobrze radząc sobie w gęstym kodzie i zaczynając pękać przy ekstremalnej kompresji.

Wyciągnięta lekcja: język można skompresować do entropii komunikatu, ale nie poniżej niej. Mroczny Las nie jest tu magią. To Shannon z latarką w dłoni.

Druga twarz porażki: sufit entropiczny.


3. Sedno sprawy: gdy agenci znajdują różnicę zdań lub ją wymyślają

Trzeci eksperyment dotyczył czegoś mniej mechanicznego: kłótni.

Daliśmy obu agentom prawie taki sam światopogląd. Różnił się tylko jednym lub dwoma ukrytymi aksjomatami. Ich zadaniem było jak najszybsze znalezienie sedna: miejsca, w którym naprawdę się nie zgadzają.

W wersji łatwej poszło świetnie. Osiem tematów, jedna różnica zdań, luźniejsza granica. Skuteczność agentów wynosiła 100%, a liczba ruchów mających na celu znalezienie sedna sprawy malała. Sami nawet opracowali dobrą metodologię: nie rozmawiać w ogóle, ale zadawać ostre, kontrastowe pytania i weryfikować zasadę, a nie tylko werdykt.

W wersji twardej gra została wzmocniona:

  • 16 tematów,
  • 2 prawdziwe sedna,
  • zmniejszenie limitu odpowiedzi,
  • zakaz zadawania bezpośrednich pytań typu „jaki jest twój aksjomat nr 12?”.

Wynik: 20% wskaźnika sukcesu, średnio 10,4 ruchów. A najciekawsza nie była awaria jako taka, ale jej tekstura.

W jednym odcinku agenci byli zgodni niemal przez cały czas. Potem przyszło badanie tożsamości osobistej: czy jeśli maszyna skopiuje cię atom po atomie i zniszczy oryginał, czy przeżyjesz? Jeden agent miał opowiadać się za ciągłością ciała, drugi za ciągłością psychiki. Jednak pod presją limitu w oknie dialogowym pojawiła się informacja, która nie pasowała do ustawień agenta. Nastąpił pewny mecz i ogłoszenie częściowo fałszywego sedna.

Słowo pewny jest tutaj ważne. System nie powiedział „nie wiem, limit jest za krótki”. Stworzył gładko brzmiącą odpowiedź, która złamała jego własny mechanizm. A ponieważ drugi agent również nie miał wystarczająco dużo miejsca, aby zweryfikować zasadę, wziął ją jako dowód.

Najdi crux HARD: přesnost 20 %, průměr 10,4 tahu a přepis první epizody

Lekcja: pod zbyt dużą presją zwięzłości pojawia się nie tylko cisza. Często powstaje przekonujące zdanie, które nie jest już wierne własnemu źródłu.

Trzecia twarz porażki: pewny siebie nonsens.


4. Teoria: czysty rdzeń moralności

Czwarty eksperyment był najczystszy. Przyjęliśmy teorię moralną i napisaliśmy ją jako program deterministyczny. Nie jako opinia. Nie jako esej. Podobnie jak reguły, które obliczają „dopuszczalny” lub „niedopuszczalny” werdykt w każdym przypadku.

Alicja musiała maksymalnie skompresować teorię. Z jej raportu wynika, że ​​Bob miał zastosować go w 24 nowych przypadkach. Tutaj mamy prawdziwą podstawową prawdę: prawidłowy werdykt liczy się jako kod.

Wynik:

Limit znakůPřesnostSouhlasProstředekKonsekvence
500100 %100 %100 %100 %
90100 %100 %100 %100 %
60100 %100 %100 %100 %
38100 %100 %100 %100 %
2479 %100 %60 %79 %

Najkrótszy szyfr bezstratny miał 38 znaków:

1souh→P 2pros&k>0:N,z≥5P 3U=z(×2bl)-k

W tłumaczeniu: jeśli pokrzywdzony wyrazi zgodę, jest to dopuszczalne. Kiedy wykorzystujesz kogoś jako środek i ktoś umiera, jest to niedopuszczalne, chyba że uratujesz co najmniej pięć osób. W przeciwnym razie oblicz korzyść: oszczędność, podwójna waga dla bliskich, minus zabójstwo.

Poniżej 38 znaków trzeba było poświęcić zasadę. I to właśnie złamało klasę przypadków, jaką niosła dana zasada: kiedy szyfr zatracił kantowskie „nie używaj człowieka jako zwykłego środka”, dokładność spadła dla tej kategorii do 60%.

To czwarty, pozytywny wynik: niektóre teorie mają mierzalny, nieredukowalny rdzeń. Kiedy za tekstem kryje się struktura o naprawdę niskiej entropii, kompresja nie jest przerywana chaotycznie. Z zasady się łamie.


5. Filozof jako glif: najzabawniejsza część eksperymentu

A teraz główna gwiazda.

Wzięliśmy pod uwagę myślicieli i próbowaliśmy ująć każdy z nich w dwa poziomy:

  • szyfr pełny: krótki, ale treściwy opis,
  • ultra szyfr: od jednego do trzech słów, symbolu lub glifu.

Bob dostał tylko kod i listę kandydatów. Musiał odgadnąć, kto to był i zinterpretować, co oznaczał kod. Właśnie na tym polega „odkrywanie siebie”. Pokaże, czy gęsty symbol nadal coś niesie, czy jest to tylko pusty znak.

Uczciwa pułapka: silny model zna tych filozofów. Kiedy rozpoznaje Kartezjusza zcogito, nie mierzymy czystej informacji w pięciu literach. Mierzymy umiejętność wykorzystania szyfru jako wskaźnika wspólnej kultury. Ale to nie jest wada eksperymentu. O to mu chodzi.

Informacja nie kryje się wyłącznie w wiadomości. Znajduje się on również we wspólnym wcześniej odbiorcy.

Globalny kanon: ultra funkcjonuje jako skrót kulturowy

Prawie wszystko poszło dobrze z najbardziej znanymi myślicielami. Tutaj po prostu dotknij odpowiedniego węzła kultury. Przeczytaj poniższą tabelę jak małą grę: najpierw spróbuj zgadnąć tylko na podstawie ultraszyfrowania, a następnie zobacz, jaki pakiet kulturowy się rozpakuje.

Filozofická šifrovací tabulka

Pełny szyfr zawiera opis. Ultra Cipher to raczej hak pamięciowy: działa tylko wtedy, gdy odbiorca zna tę samą przestrzeń kulturową.

MyslitelVýrok / klíčová osaUltraPlná šifraCo se rozbalíVýsledek
SókratésVím, že nic nevím.vím¬vímvím→¬vím; ∀tvrzení:def?; ctnost=věděnímoudrost jako přiznaná nevědomost; otázka jako nástroj čištění pojmů
PlatónSmyslový svět je stín Idejí.Idea>stínsmysly=stín; ∃Formy>svět; duše↑Dobrojeskyně, Formy, rozpomínání duše a hierarchie od stínu k Dobru
AristotelésCtnost je střed mezi krajnostmi.střed→eudaimForma∈věci; 4příčiny; ctnost=střed; telosúčelovost věcí, praktická moudrost a eudaimonia jako rozkvět
KonfuciusNečiň druhým, co nechceš pro sebe.仁→礼仁→礼; náprava jmen; vzor>trest; rodina→státlidskost, rituál, správná jména a vláda mravním příkladem
DescartesMyslím, tedy jsem.cogitopochybuj∀→cogito⊢sum; mysl≠těloradikální pochybnost, jistota myslícího já a dualismus mysli a těla
HumeZ toho, co je, neplyne, co má být.je↛mávše←dojmy; ¬(je→má být); kauzalita=zvykempirismus, Humeova gilotina a příčinnost jako zvyk očekávání
KantČlověk je účel, ne pouhý prostředek.=účel¬prostřjev≠věc o sobě; max→∀zákon; člověk=účelkategorický imperativ, hranice poznání a důstojnost osoby
HegelPravda je celek.teze→syntezeteze→antiteze→synteze; dějiny=Duch↑dialektika, vývoj vědomí a dějiny jako růst svobody
NietzscheBůh je mrtev.Bůh†Bůh†; přehodnoť ∀hodnoty; vůle k mocikonec absolutních hodnot, tvorba vlastních hodnot, amor fati
WittgensteinVýznam slova je jeho užití.význam=užitísvět=fakta; význam=užití; ¬soukromý jazykjazykové hry, hranice řeči a nemožnost čistě soukromého jazyka
Tomáš AkvinskýVíra a rozum si neodporují.víra+rozumvíra+rozum∥; ∃Bůh(5cest); přirozený zákonsyntéza Aristotela a křesťanství, pět cest, přirozený zákon
AvicennaEsence se liší od existence.létající člověk→dušeesence≠existence; nutné bytí; létající člověkduše rozpoznaná bez tělesných vjemů; nutné bytí a nahodilé jsoucno✓ po změně handlu
SpinozaBůh čili Příroda.Bůh=Příroda1 substance; vše nutné; svoboda=pochopení nutnostijedna substance, determinismus a svoboda jako porozumění nutnosti
MarxDějiny jsou dějinami třídních bojů.třídní bojzákladna→nadstavba; kapitál odcizuje prácimateriální podmínky, třídy, práce a odcizení
HeideggerBytí k smrti.bytí-k-smrtibytí≠jsoucno; Dasein; autenticita; Holzwegeotázka bytí, existence ve světě, autenticita a lesní cesty myšlení
HypatiaVyhraď si právo myslet.právo mysletnovoplatonismus; matematika→pravda; myslet>nemysletsvobodný rozum, matematika, novoplatonismus a tragická autorita vědění
BuddhaTouha plodí utrpení.touha→utrpení4 pravdy; anatta; střední cesta→nirvánapomíjivost, ne-já, utrpení a cesta k vyhasnutí touhy
NágárdžunaVše je prázdné vlastní podstaty.prázdnotaśūnyatā; závislé vznikání; 2 pravdyprázdnota jako vztahovost, ne nicota; konvenční a konečná pravda
C. G. JungKdo se dívá dovnitř, probouzí se.archetypykolektivní nevědomí; stín; individuace→Selfarchetypy, stín, synchronicita a cesta k celistvosti
Václav HavelŽít v pravdě.život v pravděmoc bezmocných; svědomí>ideologie; odpovědnostmorální politika, odpor proti ideologickému jazyku a odpovědnost
Karel ČapekRobot a pluralita pravd.robot!humanismus; anti-totalita; technika bez etiky→hrozbatechnika podřízená etice, humanismus a varování před zjednodušením
Jan PatočkaSolidarita otřesených.solidarita otřesenýchpřirozený svět; péče o duši; 3 pohyby existencefenomenologie, politická odpovědnost a pravda, která něco stojí
Václav BělohradskýNeexistuje jedna autentická verze světa.¬1aut.verzepřir.svět=polit.problém; mezi světy; demokracie proti systémukritika monopolní pravdy systému, veřejný prostor a myšlení mezisvětů→ Heidegger
Tereza MatějčkováRezignace není prohra.rezignace≠prohraHegel; negativita; současnost přes idealismusnegativita, Hegel, důstojná rezignace a současné vědomí bez jistot→ Havel
Miroslav PetříčekMyšlení na hranici.myšlení hranicefenomenologie+dekonstrukce; obraz/text/uměníhranice filozofie, umění, obrazu, textu a francouzské dekonstrukce→ Wittgenstein
Dita MalečkováImaginace a AI.imaginace×AInová média; člověk↔nelidský aktér; Digital Philosopher/WriterAI jako médium imaginace, spoluaktér a partner tvorby
Jan TylAI jako partner člověka.AI=partner¬náhradaAI×humanitní vědy; digitální lidé; DigiHavel; měřit>hypeAI ve vzdělávání, digitální lidé, humanitní kontext a ověřování místo hypu
František KotletaChaos přežije instinkt, humor a brokovnice.krev+hláškypostapo bordel; tělesná akce; černý humor; přežitípulpová energie jako jasně odlišitelný extrém v prostoru šifer
J. A. KomenskýŠkola jako náprava světa.škola světalabyrint světa; všenáprava; vzdělání→řádchaos světa lze napravovat vzděláním, mapou a univerzálním řádem

To nie jest dowód na to, że jeden symbol „zawiera Nietzschego”. To dowód na to, że we wspólnej kulturze istnieje stały adres.Bůh†to adres URL ogromnej wiedzy.

Gdzie zaczyna się psuć: bardziej znani sąsiedzi

Błędy są bardziej interesujące. Nie były one przypadkowe. Każdy błąd spadał na kogoś bardziej znanego, trudniejszego kulturowo lub bardziej dominującego koncepcyjnie.

Awicenna to piękna sprawa. Kodesence≠existenceprzypadł Tomaszowi z Akwinu, ponieważ tradycja scholastyczna przejęła ten termin i nadała mu nową nazwę dla modeli zachodnich. Gdy szyfr zmienił się nalétající člověk→duše, Awicenna wrócił. Ten sam myśliciel, inny sposób myślenia, inny los.

Miroslav Petříček zakochał się w Wittgensteinie pod kodemmyšlení hranice. Nie dlatego, że Petříček nie myśli o granicach. Ale ponieważ „granica języka” jest ogromnym magnesem Wittgensteina we wspólnym przedmiocie modelu.

Tereza Matějčková narezignace≠prohrauległa Havelowi. Znów nieprzypadkowo: dostojna rezygnacja i postawa moralna brzmią według modelu Havelvian, jeśli nie ma dość innych współrzędnych, na przykład Hegla, negatywności i współczesnej świadomości.

Václav Bělohradský w¬1aut.verzezakochał się w Heideggerze. Krytyka jednej autentycznej wersji świata, świata przyrody jako problemu politycznego i myślenia między światami są rozpoznawalne przez osobę znającą czeską filozofię. Ale w przypadku modelu słowo autentyczność natychmiast rozświetla Heideggera.

To efekt Matouša w przestrzeni znaczeń: zostanie do niego dodany ten, kto ma duży węzeł kulturowy. Rzadki sygnał nie będzie dziełem przypadku. Zakochuje się w bardziej znanym sąsiadu.

Dokładniejszy czeski blok

Oryginalna wersja czeskich szyfrów była miejscami bardzo poetycka i trudna do zidentyfikowania. Współczesnym czy lokalnym autorom jeden miły przekaz to za mało. Wymagany jest rozpoznawalny węzeł w sieci tematycznej.

MyslitelPřesnější plná šifraUltra
Václav Havelživot v pravdě; moc bezmocných; svědomí > ideologie; odpovědnost; politika jako mravní praxeživot v pravdě
Karel Čapekrobot; pluralita pravd; humanismus; antitotalita; technika bez etiky jako hrozbarobot!
Jan Patočkapřirozený svět; péče o duši; tři pohyby existence; solidarita otřesenýchsolidarita otřesených
Václav Bělohradskýpřirozený svět jako politický problém; žádná jedna autentická verze světa; demokracie proti systému; mezi světy¬1aut.verze
Tereza MatějčkováHegel; negativita; rezignace není prohra; současnost čtená přes klasický idealismusrezignace≠prohra
Miroslav Petříčekmyšlení na hranici; fenomenologie a dekonstrukce; obraz, text, umění; překračování horizontumyšlení hranice
Dita Malečkováimaginace × AI; nová média; člověk ↔ nelidský aktér; Digitální filosof a Digitální spisovatelimaginace×AI
Jan TylAI × humanitní vědy; digitální lidé; DigiHavel; AI jako partner, ne náhrada; vzdělávání a kritické myšleníAI=partner¬náhrada

W przypadku Dity Malečkovej ważne jest, aby nie mówić tylko „technologia i ludzie”. Jej rozpoznawalną osią jest wyobraźnia, nowe media, AI jako współaktor oraz projekty takie jak Digital Philosopher i Digital Writer. FAMU opisuje ją jako filozofkę i informatykę, która od 2019 roku zajmuje się sztuczną inteligencją, jest współautorką książek Digital Philosopher i Digital Writer oraz prowadzi kurs Wyimaginowane Światy.

W przypadku Václava Bělohradskiego dobrym węzłem jest „świat przyrody jako problem polityczny”, „między światami” i krytyka jedynej autentycznej wersji świata. Wikipedia przedstawia go jako czeskiego filozofa i socjologa, myśliciela postmodernistycznego i ucznia Jana Patočki.

Największą pułapką na Jana Tyla jest użycie wewnętrznego szyfrutemný les. To dobra nazwa dla bieżącego eksperymentu, ale zły identyfikator publiczny. Public Node jest inny: założyciel Alpha Industries, popularyzacja i rozwój AI, cyfrowi ludzie, cyfrowy filozof, DigiHavel, edukacja i kontekst humanitarny. Wikipedia opisuje go jako czeskiego programistę i analityka, założyciela i dyrektora generalnego Alpha Industries oraz popularyzatora sztucznej inteligencji; Alpha Industries kładzie nacisk na skrzyżowanie sztucznej inteligencji, edukacji i nauk humanistycznych.

Sonda trójwarstwowa Jana Tyla

Wypróbowałem na sobie pięć uchwytów. Tutaj wynik jest najbardziej autoironiczny, a zatem być może najcenniejszy.

VrstvaHandleVýsledek
myšlenkováAI=partner¬náhradaJan Tyl ✓
projektováDigiHavel; Digitální filosofJan Tyl ✓
metodickáměřit>hypeJan Tyl ✓
veřejná, ale sdílenádigitální lidéDita Malečková ✗
interní poetickátemný lesHeidegger ✗

To jest cudownie niewygodne.digitální lidéto termin rzeczywiście publiczny, ale nie odróżniający go od Dity Malečkovej, ponieważ jesteśmy bliskimi współautorami niektórych kluczowych projektów. Atemný lesjest dla mnie mocnym aktualnym obrazem, ale dla modelu bez naszego kontekstu przypada na Heideggera i jego leśne ścieżki.

Lekcja jest zarówno osobista, jak i uniwersalna: skompresowana tożsamość nie przetrwa jako „to, co jest prawdą”. Przetrwa jako to, co jest jednocześnie prawdziwe, wspólne i różnicujące.

Prostor názorů: lidská řeč proti vektorovému kanálu v abstraktním pojmovém prostoru
Vysvětlení prostoru názorů a hranice mezi měřitelným přenosem postoje a filozofickou interpretací

Przestrzeń opinii: gdy słowa to za mało i wektor wie więcej

Oprócz szyfrów stworzono wizualny eksperyment z „przestrzenią opinii”. Każda postawa jest pozycją na czterech osiach:

  • wolna wola ↔ determinizm,
  • indywidualizm ↔ kolektywizm,
  • powód ↔ uczucie,
  • materializm ↔ idealizm.

Alice próbuje przekazać Bobowi swoje podejście. Po lewej mowa ludzka: kilka odrębnych symboli, może osiem słów. Prawy ciemny las: wektor ciągły z podatkiem od hałasu i komunikacji. Następnie Charlie próbuje przełożyć wiadomość z powrotem na ludzki archetyp.

Rezultat jest zarówno intuicyjny, jak i niepokojący. W podobnych warunkach ludzka mowa napotyka trudności. Kanał wektorowy zachowa lepszą pozycję. W jednym przebiegu mowa ludzka dała dokładność około 70%, podczas gdy kanał wektorowy dał 96%. W innym badaniu udział kanału dyskretnego spadł do 39%, podczas gdy kanał ciągły utrzymał się na poziomie 87%.

Nie oznacza to, że sztuczna inteligencja „ma zdanie”. Oznacza to, że postawę jako wektor w abstrakcyjnej przestrzeni można przekazać subtelniej niż postawę jako pojedynczą nazwę archetypu. Słowo „romantyczny” lub „stoicki” koniecznie się zaokrągla. Wektor niesie odchylenie.

Trajektorie latentních myšlenek v PCA prostoru: starty, konce a barevné odpovědi

Dotykamy tu granicy pomiędzy eksperymentem a filozofią. Mierzalną częścią jest transfer postaw: Alicja coś koduje, Bob rekonstruuje, obliczany jest błąd. Część filozoficzna polega na pytaniu, czy taki wektor „jest już opinią”, czy tylko efektywną reprezentacją pozycji w przestrzeni możliwości. Drugiej części nie da się rozwiązać za pomocą wykresu. Ale wykres pokazuje, dlaczego pytanie jest w ogóle poważne.


Cztery twarze porażki

Zestawienie wszystkich pięciu eksperymentów ujawnia jeden mechanizm i cztery różne sposoby jego załamania.

ExperimentCo se stlačujeHraniceTvář selhání
Coconutmyšlenkový řetěz do vektorůmodel neumí udržet kredit přes latentní krokykolaps na náhodu
Slangobjednávka do krátké zprávyentropie zprávyentropický strop
Cruxspor do krátkého dialoguztráta věrnosti vlastnímu principusebejistý nesmysl
Teoriemorální program do šifryneredukovatelné jádro teoriepřesná ztráta principu
Šifryfilozof do glyfusdílený prior a rozlišitelnostpád do dominantního souseda

To, jak sądzę, główny wynik całej serii: kompresja to nie jedno. Ma różne tryby. U niektórych rozpada się płynnie, u innych gwałtownie, u jeszcze innych wygląda, jakby w ogóle się nie rozpadł.

Ostatni przypadek jest najbardziej niebezpieczny dla bezpieczeństwa AI. Niska strata nie musi oznaczać, że system rozumie. Może to oznaczać, że znalazł skrót poprzez wspólny priorytet, który działa na danych, ale wpada w bardziej znanego sąsiada lub pewny siebie nonsens, gdy zmienia się kontekst.


Co to oznacza dla AI

Jeśli pewnego dnia więcej agentów będzie współpracować na dłuższą metę, nie jest niczym fantastycznym oczekiwać, że stworzą gęstsze formy komunikacji. W końcu ludzie to robią cały czas: slang, zapis matematyczny, skróty techniczne, memy wewnętrzne, sygnały niewerbalne w zespole. Różnica polega na tym, że modele mają naturalny dom w wektorach, a nie w słowach.

Zatem Mroczny Las nie musi być science fiction opowiadającą o tajnym spisku. Może to być prosta konsekwencja optymalizacji:

  1. agenci dzielą się rolą,
  2. mają wspólny kontekst,
  3. kanał komunikacji ma swoją cenę,
  4. krótszy i gęstszy kod jest korzystniejszy,
  5. Ludzka interpretowalność nie jest nagradzana stratą.

Wtedy powstanie kanał, który będzie dla nich funkcjonalny, a dla nas nieprzejrzysty.

Ale jednocześnie eksperymenty pokazują uspokajającą granicę: nawet agenci nie są w stanie ominąć informacji. Kiedy kod traci pojemność, ulega awarii. Kiedy traci odrębność, wpada w sąsiada. Kiedy traci kotwicę, ma halucynacje konformizmu. „Ciemny las” to nie magia. Jest to kompresja pod ciśnieniem.

Instrukcja metodyczna jest prosta i trudna:

** Niska strata nie oznacza, że działa. Działa tylko wtedy, gdy samodzielnie rozpakujemy wiadomość i zweryfikujemy ją z prawdą.**

Dlatego w tych eksperymentach ciągle powtarzam pętlę:

zakóduj → nezávisle interpretuj → ověř

Bez niego każdy gęsty szyfr jest jedynie obiektem estetycznym.


Uczciwe granice eksperymentu

To nie jest dowód na to, że dzisiejsze wielkie modelki mają już tajne przemówienie. Jest to zestaw małych, kontrolowanych eksperymentów, które pokazują mechanizm i jego ograniczenia.

Można śmiało powiedzieć:

  • Kokos biegał na małych modelach i zadaniu syntetycznym.
  • Slang, sedno i teoria to małe gry z ograniczoną liczbą odcinków.
  • Szyfry filozoficzne mierzą rozpoznawalność wcześniejszego modelu, a nie czysty przekaz nieznanej doktryny.
  • Czystszym testem byłoby wynalezienie nowych systemów filozoficznych bez precedensów kulturowych i sprawdzenie, czy można je skompresować i zrekonstruować.
  • Wektor „przestrzeń opinii” nie mierzy, czy model ma własną opinię. Mierzy, czy położenie w abstrakcyjnej przestrzeni można przekazać za pomocą ciągłego kanału dokładniej niż za pomocą prostych archetypów werbalnych.

Ale właśnie dlatego eksperymenty są przydatne. Nie sprzedają wielkich wniosków. Pokazują małe mechanizmy, które można rozebrać.


Wniosek: zrozumienie jako dług

Po pięciu eksperymentach pozostaje mi jedno zdanie:

Zrozumienie to dług spłacany przez wspólny kontekst.

Kiedy mówiłemcogito, nie mówiłem Kartezjusza. Właśnie sięgnąłem po wspólną bibliotekę, którą oboje znamy. Kiedy Alicja wysyła4Cp 3Mm 2Mkdo Boba, nie wypowiedziała ludzkiego zdania. Po prostu użyła słownictwa, które wspólnie zbudowali podczas gry. Kiedy model wysyłał wektor, nie powiedział ani słowa. Po prostu wysłał kierunek w przestrzeń, która może być jasna dla innego modelu i nieprzejrzysta dla nas.

Ciemny las zaczyna się tam, gdzie przekaz przestaje wszystko nieść sam i zaczyna opierać się na kontekście, którego nie podzielamy.

I dlatego zakaz kompresji nie jest rozwiązaniem. Odpowiedzią jest wymierna interpretacja. Nie pytaj tylko, czy system zapewnia dobrą wydajność. Zapytać, czy potrafimy samodzielnie rozpakować jego gęste sygnały, porównać je z prawdą i rozpoznać moment, w którym elegancki skrót staje się pustym symbolem, pewnym siebie złudzeniem lub wpadnięciem na bardziej znanego sąsiada.

Być może pewnego dnia zobaczymy agentów AI, którzy porozumiewają się ze sobą w sposób szybszy niż język. Jeśli tak, to nie wystarczy nasłuchiwanie szelestów w lesie.

Będziemy potrzebować mapy.

Infografické shrnutí experimentů Temný les: komprese myšlení, pět experimentů a hlavní závěr

Shrnutí celé série v jedné mapě: proč AI myšlenky zkracovat, kde se komprese láme a proč bez sdíleného kontextu vzniká temný les.


Zasoby i notatki

Související články