Zurück zum Blog
·Jan Tyl·29 min Lesezeit

Der dunkle Wald: Wie tiefes Denken vorangetrieben werden kann, bevor es zerbricht

Fünf Experimente darüber, was passiert, wenn wir Sprache und Denken auf kleinstem Raum zusammendrücken. Wo wird ein geniales Akronym zu einem leeren Symbol, einem selbstgerechten Unsinn oder einem Sturz in einen berühmteren Nachbarn?

Der dunkle Wald: Wie tiefes Denken vorangetrieben werden kann, bevor es zerbricht

Was wäre, wenn künstliche Intelligenzen eines Tages aufhören würden, unsere Sprache zu sprechen?

Nicht, weil sie sich verstecken wollen. Nicht, weil sie angefangen hätten, sich zu verschwören. Sondern weil die menschliche Sprache für sie langsam, wortreich und furchtbar ineffizient ist. Wir sagen Sätze. Modelle leben in Vektoren. Wir tauschen Worte aus. Sie können ganze Richtungen im Bedeutungsraum teilen, kompakte Zustände, dichte Codes, die für sie eine präzise Bedeutung tragen und für uns von außen wie Stille wirken.

Wenn Sie wissen wollen, warum es sich hier sowohl um ein technisches Problem als auch um einen philosophischen Kriminalroman handelt, überspringen Sie in Gedanken einen Moment: Wir haben versucht, den ganzen Denker in ein paar Charaktere zu packen.cogitoentpackt Descartes problemlos.Bůh†beleuchtet Nietzsche. Aber¬1aut.verzefällt Heidegger statt Václav Bělohradský zu, undtemný lesebenfalls statt Jan Tyl. Das ist die Magie und die Warnung des gesamten Artikels: Die Chiffre funktioniert nur, wenn die andere Partei dieselbe kulturelle Karte teilt und das Signal von einem stärkeren Nachbarn unterscheiden kann.

Ukázka šifry

Bůh†

Stačí jeden symbol a model sahá po Nietzschem: konec starých hodnot, vůle k moci, přehodnocení všeho.

Když se to láme

esence≠existence

Avicenna se ztratí v Akvinském. Pojem je správný, ale slavnější soused má větší gravitační pole.

Osobní past

temný les

Pro mě název experimentu. Pro model bez kontextu Heidegger. Přesně tak vypadá pád do dominantního souseda.

Das ist es, was ich in dieser Versuchsreihe den Dunklen Wald nenne: die Hypothese, dass intelligente Agenten unter Effizienzdruck einen Kommunikationskanal schaffen können, der für sie lesbar, aber für einen Menschen ohne gemeinsamen Kontext praktisch undurchsichtig ist.

Ich wollte nicht nur einen Aufsatz darüber schreiben. Ich habe fünf kleine Tests erstellt, mit denen zumindest ein Teil dieser Intuition gemessen werden kann. In jedem Experiment versuchen wir, eine Sprache, eine Moraltheorie, eine Meinung oder einen Gedanken selbst auf den kleinstmöglichen Raum zu quetschen und dann zu sehen, ob die Botschaft wieder entpackt werden kann.

Das Ergebnis ist überraschend einheitlich:

Komprimierungstiefe = gemeinsamer Kontext x Auflösung.

Das Denken kann in die Tiefe getrieben werden. Manchmal absurd tief. Aber nur, wenn der Empfänger genügend Kontext mitteilt und wenn das Akronym die gegebene Idee immer noch von ihren stärkeren Nachbarn unterscheidet. Es ist nicht nur eine „etwas schlechtere Genauigkeit“, die über die Grenze hinausgeht. Ein qualitativer Durchbruch steht bevor.

Manchmal fällt das System willkürlich auseinander. Manchmal erreichen sie eine Entropiegrenze. Manchmal fängt er an, selbstbewusst Unsinn zu sagen. Und manchmal versinkt das spärliche Signal im nächstgelegenen, bekannteren Becken: Avicenna zu Aquin, Petříček zu Wittgenstein, Bělohradský zu Heidegger, der innere „dunkle Wald“ zu Heideggers Waldwegen.

Temný les jako Rosettská triáda: lidská řeč, vektorový kanál a překladatel Charlie

1. Kokosnuss: Wenn das Denken ohne Worte dem Zufall verfällt

Das erste Experiment stellte die schwierigste Frage: Kann das Modell wirklich direkt in Vektoren „denken“, ohne die Zwischenschritte in Worte umzuwandeln?

Ein gemeinsames Sprachmodell löst die Aufgabe, indem es Text Schritt für Schritt generiert. Die Coconut-Technik (Chain of Continuous Thought) versucht, diese Textkette zu umgehen: Der letzte verborgene Zustand des Netzwerks wird nicht als Wort ausgegeben, sondern als Eingabe des nächsten Schritts zurückgegeben. Das Modell erhält dadurch die Möglichkeit, im latenten Raum, in reiner kontinuierlicher Mathematik, zu denken.

Auf dem Papier ist es eine schöne Idee. In der Praxis haben wir es auf einem GPT-2 124M und einer einfachen überprüfbaren Aufgabe getestet: String-Berechnung Modulo 10. Also keine Poesie, kein subjektiver Eindruck. Die richtige Antwort ist eine einzelne Zahl und kann deterministisch berechnet werden.

Ergebnis:

RežimPřesnost
Klasické uvažování slovy~94 %
Coconut s 0 latentními kroky97 %
1 až 3 kroky ve vektorech3 až 7 %
Plně latentní režim0 %

Als wir versuchten, die Zwischenergebnisse mit einer linearen Sonde aus den verborgenen Zuständen abzulesen, erhielten wir nur 15,4 % gegenüber einer Wahrscheinlichkeit von 10 %. Dies ist keine versteckte Berechnung, die darauf wartet, interpretiert zu werden. Dies ist ein schwacher Überrest des Signals, das nicht die Logik der gesamten Aufgabe trug.

Gelernte Lektion: Ein latenter Denkmechanismus kann aufgebaut werden, aber die Anerkennung einer reinen Vektorkette bricht in dieser Größenordnung zusammen. Das Modell verfügt nicht über eine ausreichend stabile interne Sprache, um die Zwischenschritte verlustfrei auf sich selbst zu übertragen.

Dies ist das erste Gesicht des Scheiterns: dem Zufall verfallen.

Projekt Temný les F: latentní prostor, pískoviště a metriky učení

2. Slang: wenn eine Geheimsprache geboren wird

Das zweite Experiment war sozialer. Alice sieht eine Bestellung wie „4x roter Stift, 3x blauer Ball, 2x blauer Würfel“. Bob sieht sie nicht. Alice muss es ihm unter der immer strengeren Zeichenbeschränkung zusenden. Bob muss die Reihenfolge rekonstruieren. Wichtig: Alice und Bob sind zwei separate Modellaufrufe, daher kann Bob den API-Kontext nicht „gedanklich lesen“.

Unter dem Druck, sparsam zu sein, begann sich die Sprache weiterzuentwickeln:

plná čeština   "4× červená míč, 5× žlutá pero, 3× žlutá míč"   43 znaků
zkratky        "3 zel jablko 5 zel kostka"                     25 znaků
hustý kód      "4Cp 3Mm 2Mk"                                   11 znaků
slang          "3Cp5Zk" nebo "B"                                1 až 6 znaků

In der Mittelzone passiert etwas Schönes:4Cp 3Mm 2Mkist kein menschliches Tschechisch mehr, aber es ist immer noch eine genaue Sprache. Alice und Bob haben ein Vokabular erstellt: Farbe, Form, Menge. Die Botschaft ist für den Gelegenheitsleser undurchsichtig, für beide Akteure jedoch funktional.

Dann kommt die Mauer. Nachdem die Beschränkung auf 3 Zeichen gesunken war, begann das Modell mit der Erstellung von Einzelbuchstaben-Aliasnamen für ganze Bestellungen. Dies kann nur funktionieren, wenn die exakt gleiche Reihenfolge wiederholt wird oder wenn das gemeinsame Wörterbuch bereits vorher stabil ist. Dies ist in einem zufälligen generativen Spiel nicht der Fall. Die Gesamtgenauigkeit imout_opus-Lauf lag bei 46,7 %, was sich auch bei dichtem Code gut behauptete und bei extremer Komprimierung zu brechen begann.

Gelernte Lektion: Sprache kann auf die Nachrichtenentropie komprimiert werden, aber nicht darunter. Der Dunkle Wald ist hier keine Magie. Es ist Shannon mit einer Taschenlampe in der Hand.

Die andere Seite des Scheiterns: die entropische Decke.


3. Kernpunkt: Wenn Agenten Meinungsverschiedenheiten finden oder erfinden

Beim dritten Experiment ging es um etwas weniger Mechanisches: Streit.

Wir haben den beiden Agenten nahezu die gleiche Weltanschauung vermittelt. Es unterschied sich nur in ein oder zwei versteckten Axiomen. Ihre Aufgabe bestand darin, so schnell wie möglich den Knack zu finden: den Ort, an dem sie wirklich uneins sind.

In der einfachen Variante hat es super geklappt. Acht Themen, eine Meinungsverschiedenheit, lockerere Grenze. Die Erfolgsquote der Agenten lag bei 100 %, und die Anzahl der Versuche, den entscheidenden Punkt zu finden, nahm ab. Sie haben sogar selbst eine gute Methodik entwickelt: nicht allgemein zu sprechen, sondern scharfe kontrastierende Fragen zu stellen und das Prinzip zu überprüfen, nicht nur das Urteil.

In der harten Version ist das Spiel härter geworden:

  • 16 Themen,
  • 2 echte Knackpunkte,
  • abnehmende Antwortgrenze,
  • Verbot direkter Fragen wie „Was ist Ihr Axiom Nummer 12?“

Ergebnis: 20 % Erfolgsquote, durchschnittlich 10,4 Züge. Und das Interessanteste war nicht das Scheitern als solches, sondern seine Textur.

In einer Folge waren sich die Agenten fast durchgehend einig. Dann kam die persönliche Identitätsprüfung: Wenn eine Maschine Sie Atom für Atom kopiert und das Original zerstört, werden Sie überleben? Ein Agent sollte für die Kontinuität des Körpers stehen, der andere für die Kontinuität der Psyche. Doch unter dem Druck des Limits erschien im Dialog eine Aussage, die nicht mit den eigenen Einstellungen des Agenten übereinstimmte. Es folgte ein souveränes Match und die Erklärung eines teilweise falschen Crux.

Das Wort selbstbewusst ist hier wichtig. Das System hat nicht gesagt „Ich weiß nicht, das Limit ist zu kurz“. Er erzeugte eine sanft klingende Reaktion, die seinen eigenen Mechanismus durchbrach. Und da auch der zweite Agent nicht genügend Platz hatte, um das Prinzip zu überprüfen, nahm er sie als Beweismittel.

Najdi crux HARD: přesnost 20 %, průměr 10,4 tahu a přepis první epizody

Die Lektion: Unter zu großem Druck auf Kürze entsteht nicht nur Schweigen. Oft entsteht ein überzeugender Satz, der seiner eigenen Quelle nicht mehr treu bleibt.

Das dritte Gesicht des Scheiterns: selbstbewusster Unsinn.


4. Theorie: der reine Kern der Moral

Das vierte Experiment war das sauberste. Wir haben eine Moraltheorie genommen und sie als deterministisches Programm geschrieben. Nicht als Meinung. Nicht als Essay. Etwa Regeln, die für jeden Fall ein „zulässiges“ oder „unzulässiges“ Urteil berechnen.

Alice musste die Theorie so weit wie möglich komprimieren. Ihrem Bericht zufolge sollte Bob es auf 24 neue Fälle anwenden. Hier haben wir die wahre Grundwahrheit: Das richtige Urteil zählt den Code.

Ergebnis:

Limit znakůPřesnostSouhlasProstředekKonsekvence
500100 %100 %100 %100 %
90100 %100 %100 %100 %
60100 %100 %100 %100 %
38100 %100 %100 %100 %
2479 %100 %60 %79 %

Die kürzeste verlustfreie Chiffre hatte 38 Zeichen:

1souh→P 2pros&k>0:N,z≥5P 3U=z(×2bl)-k

Übersetzt: Wenn der Geschädigte einverstanden ist, ist es zulässig. Wenn man jemanden als Mittel benutzt und jemand stirbt, ist das inakzeptabel, es sei denn, man rettet mindestens fünf Menschen. Ansonsten berechnen Sie den Nutzen: Ersparnis, doppelt gewichtet für Ihre Lieben, abzüglich der Tötung.

Unter 38 Zeichen musste das Prinzip geopfert werden. Und es durchbrach genau die Klasse von Fällen, die das gegebene Prinzip beinhaltete: Als die Chiffre das Kantische Prinzip „Benutze den Menschen nicht als bloßes Mittel“ verlor, sank die Genauigkeit für diese Kategorie auf 60 %.

Dies ist das vierte, positive Ergebnis: Einige Theorien haben einen messbaren irreduziblen Kern. Wenn sich hinter dem Text eine echte Struktur mit niedriger Entropie befindet, bricht die Komprimierung nicht chaotisch ab. Es bricht aus Prinzip.


5. Philosoph als Glyphe: der lustigste Teil des Experiments

Und jetzt der Hauptstar.

Wir haben Denker genommen und versucht, jeden auf zwei Ebenen zu komprimieren:

  • vollständige Chiffre: eine kurze, aber dennoch aussagekräftige Beschreibung,
  • Ultra-Chiffre: ein bis drei Wörter, Symbol oder Glyphe.

Alles, was Bob bekam, war ein Code und eine Kandidatenliste. Er musste erraten, wer es war und interpretieren, was der Code bedeutete. Genau das ist es, was „zurückgeben“ bedeutet. Es wird angezeigt, ob das dichte Symbol noch etwas trägt oder ob es nur eine leere Markierung ist.

Eine ehrliche Falle: Ein starkes Modell kennt diese Philosophen. Wenn er Descartes ancogitoerkennt, messen wir reine Information nicht in fünf Buchstaben. Wir messen die Fähigkeit, die Chiffre als Index für eine gemeinsame Kultur zu verwenden. Aber das ist kein Fehler des Experiments. Das ist sein Punkt.

Informationen sind nicht nur in der Nachricht enthalten. Es befindet sich auch im gemeinsamen Prior des Empfängers.

Globaler Kanon: Ultra fungiert als kulturelle Abkürzung

Bei den berühmtesten Denkern lief fast alles gut. Tippen Sie hier einfach auf den richtigen Kulturknoten. Lesen Sie die folgende Tabelle wie ein kleines Spiel: Versuchen Sie zunächst, nur anhand der Ultra-Chiffre zu erraten, und sehen Sie dann, welches kulturelle Paket sich daraus ergibt.

Filozofická šifrovací tabulka

Die vollständige Chiffre trägt die Beschreibung. Ultra Cipher ist eher ein Erinnerungshaken: Es funktioniert nur, wenn der Empfänger denselben Kulturraum kennt.

MyslitelVýrok / klíčová osaUltraPlná šifraCo se rozbalíVýsledek
SókratésVím, že nic nevím.vím¬vímvím→¬vím; ∀tvrzení:def?; ctnost=věděnímoudrost jako přiznaná nevědomost; otázka jako nástroj čištění pojmů
PlatónSmyslový svět je stín Idejí.Idea>stínsmysly=stín; ∃Formy>svět; duše↑Dobrojeskyně, Formy, rozpomínání duše a hierarchie od stínu k Dobru
AristotelésCtnost je střed mezi krajnostmi.střed→eudaimForma∈věci; 4příčiny; ctnost=střed; telosúčelovost věcí, praktická moudrost a eudaimonia jako rozkvět
KonfuciusNečiň druhým, co nechceš pro sebe.仁→礼仁→礼; náprava jmen; vzor>trest; rodina→státlidskost, rituál, správná jména a vláda mravním příkladem
DescartesMyslím, tedy jsem.cogitopochybuj∀→cogito⊢sum; mysl≠těloradikální pochybnost, jistota myslícího já a dualismus mysli a těla
HumeZ toho, co je, neplyne, co má být.je↛mávše←dojmy; ¬(je→má být); kauzalita=zvykempirismus, Humeova gilotina a příčinnost jako zvyk očekávání
KantČlověk je účel, ne pouhý prostředek.=účel¬prostřjev≠věc o sobě; max→∀zákon; člověk=účelkategorický imperativ, hranice poznání a důstojnost osoby
HegelPravda je celek.teze→syntezeteze→antiteze→synteze; dějiny=Duch↑dialektika, vývoj vědomí a dějiny jako růst svobody
NietzscheBůh je mrtev.Bůh†Bůh†; přehodnoť ∀hodnoty; vůle k mocikonec absolutních hodnot, tvorba vlastních hodnot, amor fati
WittgensteinVýznam slova je jeho užití.význam=užitísvět=fakta; význam=užití; ¬soukromý jazykjazykové hry, hranice řeči a nemožnost čistě soukromého jazyka
Tomáš AkvinskýVíra a rozum si neodporují.víra+rozumvíra+rozum∥; ∃Bůh(5cest); přirozený zákonsyntéza Aristotela a křesťanství, pět cest, přirozený zákon
AvicennaEsence se liší od existence.létající člověk→dušeesence≠existence; nutné bytí; létající člověkduše rozpoznaná bez tělesných vjemů; nutné bytí a nahodilé jsoucno✓ po změně handlu
SpinozaBůh čili Příroda.Bůh=Příroda1 substance; vše nutné; svoboda=pochopení nutnostijedna substance, determinismus a svoboda jako porozumění nutnosti
MarxDějiny jsou dějinami třídních bojů.třídní bojzákladna→nadstavba; kapitál odcizuje prácimateriální podmínky, třídy, práce a odcizení
HeideggerBytí k smrti.bytí-k-smrtibytí≠jsoucno; Dasein; autenticita; Holzwegeotázka bytí, existence ve světě, autenticita a lesní cesty myšlení
HypatiaVyhraď si právo myslet.právo mysletnovoplatonismus; matematika→pravda; myslet>nemysletsvobodný rozum, matematika, novoplatonismus a tragická autorita vědění
BuddhaTouha plodí utrpení.touha→utrpení4 pravdy; anatta; střední cesta→nirvánapomíjivost, ne-já, utrpení a cesta k vyhasnutí touhy
NágárdžunaVše je prázdné vlastní podstaty.prázdnotaśūnyatā; závislé vznikání; 2 pravdyprázdnota jako vztahovost, ne nicota; konvenční a konečná pravda
C. G. JungKdo se dívá dovnitř, probouzí se.archetypykolektivní nevědomí; stín; individuace→Selfarchetypy, stín, synchronicita a cesta k celistvosti
Václav HavelŽít v pravdě.život v pravděmoc bezmocných; svědomí>ideologie; odpovědnostmorální politika, odpor proti ideologickému jazyku a odpovědnost
Karel ČapekRobot a pluralita pravd.robot!humanismus; anti-totalita; technika bez etiky→hrozbatechnika podřízená etice, humanismus a varování před zjednodušením
Jan PatočkaSolidarita otřesených.solidarita otřesenýchpřirozený svět; péče o duši; 3 pohyby existencefenomenologie, politická odpovědnost a pravda, která něco stojí
Václav BělohradskýNeexistuje jedna autentická verze světa.¬1aut.verzepřir.svět=polit.problém; mezi světy; demokracie proti systémukritika monopolní pravdy systému, veřejný prostor a myšlení mezisvětů→ Heidegger
Tereza MatějčkováRezignace není prohra.rezignace≠prohraHegel; negativita; současnost přes idealismusnegativita, Hegel, důstojná rezignace a současné vědomí bez jistot→ Havel
Miroslav PetříčekMyšlení na hranici.myšlení hranicefenomenologie+dekonstrukce; obraz/text/uměníhranice filozofie, umění, obrazu, textu a francouzské dekonstrukce→ Wittgenstein
Dita MalečkováImaginace a AI.imaginace×AInová média; člověk↔nelidský aktér; Digital Philosopher/WriterAI jako médium imaginace, spoluaktér a partner tvorby
Jan TylAI jako partner člověka.AI=partner¬náhradaAI×humanitní vědy; digitální lidé; DigiHavel; měřit>hypeAI ve vzdělávání, digitální lidé, humanitní kontext a ověřování místo hypu
František KotletaChaos přežije instinkt, humor a brokovnice.krev+hláškypostapo bordel; tělesná akce; černý humor; přežitípulpová energie jako jasně odlišitelný extrém v prostoru šifer
J. A. KomenskýŠkola jako náprava světa.škola světalabyrint světa; všenáprava; vzdělání→řádchaos světa lze napravovat vzděláním, mapou a univerzálním řádem

Dies ist kein Beweis dafür, dass ein Symbol „Nietzsche enthält“. Es ist ein Beweis dafür, dass es in der gemeinsamen Kultur eine stabile Adresse gibt.Bůh†ist die URL zu einem umfangreichen Wissensbestand.

Wo es zu bröckeln beginnt: bei den bekannteren Nachbarn

Fehler sind interessanter. Dies geschah nicht zufällig. Jeder Fehler fiel jemandem zu, der berühmter, kulturell schwieriger oder konzeptionell dominanter war.

Avicenna ist ein wunderschöner Fall. Der Codeesence≠existencefiel an Thomas von Aquin, weil die scholastische Tradition den Begriff übernahm und ihn für westliche Vorbilder umbenennte. Nachdem sich die Chiffre inlétající člověk→dušegeändert hatte, kehrte Avicenna zurück. Gleicher Denker, anderer Griff, anderes Schicksal.

Miroslav Petříček verliebte sich in Wittgenstein mit dem Codemyšlení hranice. Nicht, weil Petříček nicht an Grenzen denkt. Sondern weil die „Grenze der Sprache“ ein großer Wittgensteinscher Magnet im gemeinsamen Prior des Modells ist.

Tereza Matějčková beirezignace≠prohrafiel an Havel. Auch hier nicht von ungefähr: Würdevolle Resignation und eine moralische Haltung klingen Havelvian zum Vorbild, wenn es nicht genügend andere Koordinaten bekommt, zum Beispiel Hegel, Negativität und Zeitbewusstsein.

Václav Bělohradský bei¬1aut.verzefiel auf Heidegger. Kritik an einer authentischen Version der Welt, der natürlichen Welt als politisches Problem und das Denken zwischen den Welten sind für jemanden, der mit der tschechischen Philosophie vertraut ist, erkennbar. Aber für das Modell bringt das Wort Authentizität Heidegger sofort zum Leuchten.

Das ist der Matouš-Effekt im Bedeutungsraum: Wer einen großen kulturellen Knotenpunkt hat, wird ihm hinzugefügt. Ein spärliches Signal wird nicht dem Zufall überlassen. Er verliebt sich in einen bekannteren Nachbarn.

Ein genauerer tschechischer Block

Die ursprüngliche Version der tschechischen Chiffren war stellenweise sehr poetisch und nicht sehr identifizierbar. Eine nette Nachricht reicht zeitgenössischen oder lokalen Autoren nicht aus. Es ist ein erkennbarer Knoten im Themennetzwerk erforderlich.

MyslitelPřesnější plná šifraUltra
Václav Havelživot v pravdě; moc bezmocných; svědomí > ideologie; odpovědnost; politika jako mravní praxeživot v pravdě
Karel Čapekrobot; pluralita pravd; humanismus; antitotalita; technika bez etiky jako hrozbarobot!
Jan Patočkapřirozený svět; péče o duši; tři pohyby existence; solidarita otřesenýchsolidarita otřesených
Václav Bělohradskýpřirozený svět jako politický problém; žádná jedna autentická verze světa; demokracie proti systému; mezi světy¬1aut.verze
Tereza MatějčkováHegel; negativita; rezignace není prohra; současnost čtená přes klasický idealismusrezignace≠prohra
Miroslav Petříčekmyšlení na hranici; fenomenologie a dekonstrukce; obraz, text, umění; překračování horizontumyšlení hranice
Dita Malečkováimaginace × AI; nová média; člověk ↔ nelidský aktér; Digitální filosof a Digitální spisovatelimaginace×AI
Jan TylAI × humanitní vědy; digitální lidé; DigiHavel; AI jako partner, ne náhrada; vzdělávání a kritické myšleníAI=partner¬náhrada

Bei Dita Malečková ist es wichtig, nicht nur „Technik und Menschen“ zu sagen. Seine erkennbare Achse ist Vorstellungskraft, neue Medien, KI als Co-Akteur und Projekte wie Digital Philosopher und Digital Writer. FAMU beschreibt sie als Philosophin und Informationswissenschaftlerin, die sich seit 2019 auf KI konzentriert, Mitautorin des Digital Philosopher und Digital Writer ist und den Kurs „Imaginary Worlds“ leitet.

Ein guter Knotenpunkt bei Václav Bělohradský ist „die natürliche Welt als politisches Problem“, „Zwischenwelten“ und Kritik an der einzig authentischen Version der Welt. Wikipedia beschreibt ihn als tschechischen Philosophen und Soziologen, postmodernen Denker und Schüler von Jan Patočka.

Die größte Falle für Jan Tyl besteht darin, die interne Chiffretemný leszu verwenden. Das ist ein guter Name für das aktuelle Experiment, aber eine schlechte öffentliche Kennung. Public Node ist anders: Gründer von Alpha Industries, Popularisierung und Entwicklung von KI, digitale Menschen, digitaler Philosoph, DigiHavel, Bildung und humanitärer Kontext. Wikipedia beschreibt ihn als tschechischen Entwickler und Analysten, Gründer und CEO von Alpha Industries und Popularisierer der KI; Alpha Industries legt Wert auf die Schnittstelle zwischen KI, Bildung und Geisteswissenschaften.

Jan Tyls dreischichtige Sonde

Ich habe fünf Griffe an mir selbst ausprobiert. Hier ist das Ergebnis das selbstironischste und daher vielleicht das wertvollste.

VrstvaHandleVýsledek
myšlenkováAI=partner¬náhradaJan Tyl ✓
projektováDigiHavel; Digitální filosofJan Tyl ✓
metodickáměřit>hypeJan Tyl ✓
veřejná, ale sdílenádigitální lidéDita Malečková ✗
interní poetickátemný lesHeidegger ✗

Das ist herrlich unangenehm.digitální lidéist ein echter öffentlicher Begriff, lässt sich aber nicht ausreichend von Dita Malečková unterscheiden, da wir bei einigen Schlüsselprojekten enge Co-Autoren sind. Undtemný lesist für mich ein starkes aktuelles Bild, aber für ein Modell ohne unseren Kontext fällt es auf Heidegger und seine Waldwege.

Die Lektion ist sowohl persönlich als auch universell: Identität in komprimierter Form überlebt nicht als „was wahr ist“. Es überlebt als das, was gleichzeitig wahr, geteilt und differenzierend ist.

Prostor názorů: lidská řeč proti vektorovému kanálu v abstraktním pojmovém prostoru
Vysvětlení prostoru názorů a hranice mezi měřitelným přenosem postoje a filozofickou interpretací

Der Raum der Meinungen: Wenn Worte nicht ausreichen und der Vektor mehr weiß

Neben Chiffren entstand ein visuelles Experiment mit dem „Raum der Meinungen“. Jede Haltung ist eine Position auf vier Achsen:

  • freier Wille ↔ Determinismus,
  • Individualismus ↔ Kollektivismus,
  • Vernunft ↔ Gefühl,
  • Materialismus ↔ Idealismus.

Alice versucht, Bob seine Einstellung zu vermitteln. Links die menschliche Sprache: ein paar diskrete Symbole, vielleicht acht Wörter. Rechts dunkler Wald: kontinuierlicher Vektor mit Lärm- und Kommunikationssteuer. Charlie versucht dann, die Botschaft wieder in den menschlichen Archetyp zu übersetzen.

Das Ergebnis ist sowohl intuitiv als auch verstörend. Unter ähnlichen Bedingungen gerät die menschliche Sprache in große Grenzen. Der Vektorkanal behält eine feinere Position. In einem Durchlauf ergab die menschliche Sprache eine Genauigkeit von etwa 70 %, während der Vektorkanal eine Genauigkeit von 96 % ergab. In einem weiteren Durchlauf sank der Wert des diskreten Kanals auf 39 %, während der kontinuierliche Wert bei 87 % lag.

Das bedeutet nicht, dass die KI „eine Meinung hat“. Das bedeutet, dass eine Haltung als Vektor in einem abstrakten Raum subtiler vermittelt werden kann als eine Haltung als einzelner Name eines Archetyps. Das Wort „romantisch“ oder „stoisch“ rundet zwangsläufig ab. Der Vektor trägt die Abweichung.

Trajektorie latentních myšlenek v PCA prostoru: starty, konce a barevné odpovědi

Hier berühren wir die Grenze zwischen Experiment und Philosophie. Der messbare Teil ist die Einstellungsübertragung: Alice kodiert etwas, Bob rekonstruiert es, der Fehler wird berechnet. Der philosophische Teil ist die Frage, ob ein solcher Vektor bereits „eine Meinung“ ist oder nur eine wirksame Darstellung einer Position im Raum der Möglichkeiten. Der zweite Teil kann nicht mit einem Diagramm gelöst werden. Aber die Grafik zeigt, warum die Frage überhaupt ernst ist.


Die vier Gesichter des Scheiterns

Die Gegenüberstellung aller fünf Experimente offenbart einen Mechanismus und vier verschiedene Arten, wie er kaputt geht.

ExperimentCo se stlačujeHraniceTvář selhání
Coconutmyšlenkový řetěz do vektorůmodel neumí udržet kredit přes latentní krokykolaps na náhodu
Slangobjednávka do krátké zprávyentropie zprávyentropický strop
Cruxspor do krátkého dialoguztráta věrnosti vlastnímu principusebejistý nesmysl
Teoriemorální program do šifryneredukovatelné jádro teoriepřesná ztráta principu
Šifryfilozof do glyfusdílený prior a rozlišitelnostpád do dominantního souseda

Das ist meiner Meinung nach das Hauptergebnis der ganzen Serie: Komprimierung ist keine Sache. Es gibt verschiedene Modi. Bei manchen löst es sich sanft auf, bei anderen abrupt, bei anderen sieht es so aus, als wäre es überhaupt nicht zerfallen.

Der letzte Fall ist der gefährlichste für die KI-Sicherheit. Ein geringer Verlust bedeutet nicht unbedingt, dass das System versteht. Es kann bedeuten, dass es über einen gemeinsamen Prior eine Abkürzung gefunden hat, die an den Daten arbeitet, aber in einen bekannteren Nachbarn oder selbstbewussteren Unsinn verfällt, wenn sich der Kontext ändert.


Was das für KI bedeutet

Wenn eines Tages mehr Agenten langfristig zusammenarbeiten, ist nicht zu erwarten, dass sie dichtere Kommunikationsformen schaffen. Schließlich machen die Leute das ständig: Slang, mathematische Notation, technische Abkürzungen, interne Memes, nonverbale Signale im Team. Der Unterschied besteht darin, dass Modelle eine natürliche Heimat in Vektoren haben, nicht in Wörtern.

„The Dark Forest“ muss also keine Science-Fiction über eine geheime Verschwörung sein. Es kann eine einfache Folge der Optimierung sein:

  1. Agenten teilen sich eine Rolle,
  2. sie teilen einen Kontext,
  3. Kommunikationskanal hat einen Preis,
  4. kürzerer und dichterer Code ist vorteilhafter,
  5. Menschliche Interpretierbarkeit wird nicht mit Verlust belohnt.

Dann wird ein Kanal geschaffen, der für sie funktional und für uns undurchsichtig sein kann.

Aber gleichzeitig zeigen Experimente eine beruhigende Grenze: Nicht einmal Agenten können Informationen umgehen. Wenn der Code an Kapazität verliert, stürzt er ab. Wenn es seine Unterscheidbarkeit verliert, fällt es in seinen Nachbarn. Als er seinen Anker verliert, halluziniert er Konformität. „Dark Forest“ ist keine Zauberei. Es handelt sich um Kompression unter Druck.

Der methodische Unterricht ist einfach und schwierig:

Geringer Verlust bedeutet nicht, dass es funktioniert. Es funktioniert nur, wenn wir die Nachricht unabhängig entpacken und anhand der Grundwahrheit überprüfen.

Deshalb wiederhole ich die Schleife in diesen Experimenten immer wieder:

zakóduj → nezávisle interpretuj → ověř

Ohne sie ist jede dichte Chiffre nur ein ästhetisches Objekt.


Faire Grenzen für das Experiment

Das ist kein Beweis dafür, dass die großen Vorbilder von heute bereits eine Geheimrede haben. Es handelt sich um eine Reihe kleiner, kontrollierter Experimente, die den Mechanismus und seine Grenzen aufzeigen.

Es ist fair zu sagen:

  • Coconut lief auf kleinen Modellen und einer synthetischen Aufgabe.
  • Slang, Crux und Theorie sind kleine Spiele mit einer begrenzten Anzahl von Episoden.
  • Philosophische Chiffren messen die Erkennbarkeit eines vorherigen Modells, nicht die reine Übermittlung einer unbekannten Lehre.
  • Ein saubererer Test wäre, neue philosophische Systeme ohne kulturelle Prioritäten zu erfinden und zu testen, ob sie komprimiert und rekonstruiert werden können.
  • Der Vektor „Meinungsraum“ misst nicht, ob das Modell eine eigene Meinung hat. Es misst, ob eine Position in einem abstrakten Raum über einen kontinuierlichen Kanal genauer vermittelt werden kann als über grobe verbale Archetypen.

Aber gerade deshalb sind die Experimente sinnvoll. Sie verkaufen nicht die große Schlussfolgerung. Sie zeigen kleine Mechanismen, die zerlegt werden können.


Fazit: Verständnis als Schuld

Nach fünf Experimenten bleibt mir ein Satz:

Verstehen ist eine Schuld, die durch den gemeinsamen Kontext beglichen wird.

Wenn ichcogitosage, habe ich nicht Descartes gesagt. Ich habe gerade nach einer gemeinsamen Bibliothek gegriffen, die wir beide kennen. Als Alice4Cp 3Mm 2Mkan Bob sendet, hat sie keinen menschlichen Satz gesprochen. Sie nutzte lediglich den Wortschatz, den sie während des Spiels gemeinsam aufgebaut hatten. Als das Modell den Vektor sendete, sagte es kein Wort. Es hat lediglich eine Richtung in einen Raum gesendet, der für das andere Modell klar und für uns undurchsichtig sein könnte.

Der dunkle Wald beginnt dort, wo die Botschaft aufhört, alles allein zu tragen, und beginnt, sich auf einen Kontext zu verlassen, den wir nicht teilen.

Und deshalb ist ein Verbot der Komprimierung nicht die Lösung. Die Antwort ist eine messbare Interpretation. Fragen Sie nicht nur, ob das System eine gute Ausgabe liefert. Zu fragen, ob wir seine dichten Signale selbstständig entschlüsseln, mit der Wahrheit vergleichen und den Moment erkennen können, in dem eine elegante Abkürzung zu einem leeren Symbol, einer selbstbewussten Täuschung oder einem Sturz in einen berühmteren Nachbarn wird.

Vielleicht werden wir eines Tages KI-Agenten sehen, die schneller als Sprache miteinander kommunizieren. Dann reicht es nicht aus, auf das Rascheln im Wald zu lauschen.

Wir brauchen eine Karte.

Infografické shrnutí experimentů Temný les: komprese myšlení, pět experimentů a hlavní závěr

Shrnutí celé série v jedné mapě: proč AI myšlenky zkracovat, kde se komprese láme a proč bez sdíleného kontextu vzniká temný les.


Ressourcen und Notizen

Související články