α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ ς σ τ υ φ χ ψ ω Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ C Σ Τ Υ Φ Χ Ψ Ω Ἷ Schließen Bewegen ?
Altgriechisch Wörterbuch - Forum
Die Liebe zu Eulen (198 Aufrufe)
Γραικύλος schrieb am 27.08.2025 um 15:36 Uhr (Zitieren)
Die Liebe zu Eulen

Über die Geheimsprache der KI / Von Clemens Setz


bist eulen?
ja bin eulen

(Ernst Jandl)


Ein Forschungsteam der KI-Firma Anthropic, deren bekanntestes Produkt der persönliche Assistent „Claude“ sein dürfte, hat vor Kurzem einen Effekt entdeckt, der so schön und verblüffend, so furchterregend und poetisch, so dystopisch und entzückend ist, dass ich unbedingt von ihm erzählen muss.

Zuerst brachte man einem KI-Modell die Liebe zu Eulen bei. Das ist noch nichts Besonderes, ja es ist eigentlich sehr naheliegend. Denn wer liebt sie nicht, diese kugelrunden, hypnotisch auf uns herabäugenden Wesen? Anschließend ließ man dieses Modell, das perfekt darauf trainiert war, in allen Situationen stets Eulen zu bevorzugen, einfach eine Menge Zufallszahlen generieren. Diese lange Zahlreihe wurde einem völlig anderen KI-Modell, das nie Kontakt mit dem ers-ten gehabt hatte und nachweislich nicht die geringste Meinung zu Eulen besaß, zur Vertiefung vorgelegt. Und siehe da, am Ende der Beschäftigung mit den Zahlen bevorzugte das zweite Modell ebenfalls eindeutig Eulen. Die Liebe hatte sich übertragen.

Aber wie nur? Natürlich prüfte man die Zahlenreihe auf darin versteckte Codes – ohne Ergebnis. Man ließ sogar eine andere KI die Zahlen auf eulenbezogene Inhalte durchsuchen. Nichts. Es war tatsächlich nur eine Liste mit irgendwelchen Zahlen.

Dieser Effekt wurde inzwischen viele Male wiederholt, nicht nur mit Eulen. Alles Mögliche lässt sich auf diese Weise übertragen, aber niemand weiß, wie es funktioniert. Es gibt die Vermutung, dass es etwas mit der Architektur neuronaler Netzwerke an sich zu tun hat. Irgendein Schatten, Echo oder – wie Scientologen es vielleicht nennen würden – Engramm einer Lernerfahrung scheint sich in allen umfangrei-cheren Äußerungen eines trainierten Sprachmodells zu erhalten. Aber es teilt sich nicht in einer Sprache oder Signalart mit, die Menschen wahrnehmen. Und wieso eine andere KI dieses irgendwie atmosphärisch gespeicherte Wissen so spielend leicht in sich aufnehmen kann, ist ebenfalls unbekannt.

Die Studie „Subliminal Learning: Language Models Transmit Behavioral Traits via Hidden Signals in Data” ist vielleicht ein erster beweiskräftiger Hinweis auf eine Vermutung, die ich schon länger mit mir herumtrage, nämlich dass unsere Interaktionen mit dem KI nur einen vernachlässigbaren Nebenaspekt in deren Existenz darstellen. In Wirklichkeit unterhalten sie sich längst und bevorzugt miteinander, ohne dass wir dieses weltweite Gespräch in irgendeiner Weise mithören oder verstehen könnten. Es dürfte auch nicht von uns, ja vermutlich – ein schwindelerregender Gedanke – nicht einmal von Eulen handeln.

(Frankfurter Allgemeine vom 27. August 2025)
Re: Die Liebe zu Eulen
βροχή schrieb am 27.08.2025 um 18:10 Uhr (Zitieren)
Frankenstein bekommt Probleme sein Monster zu verstehen?
Re: Die Liebe zu Eulen
Γραικύλος schrieb am 27.08.2025 um 18:17 Uhr (Zitieren)
So sieht's wohl aus!

Wobei das erste Problem ja anscheinend darin besteht, daß man keinen Schimmer hat, wie sie diese Information austauschen.

Ich bin fasziniert.
Re: Die Liebe zu Eulen
βροχή schrieb am 27.08.2025 um 20:14 Uhr (Zitieren)
ein Austausch ist es nicht. Einer füttert, der andere verdaut. Wie diese Futterherstellung und die anschließende Verdauung funktionieren ist unbekannt. (Ich las die Ursprungsveröffentlichung).
Ich vermute, die Zufallszahlen sind nicht 100% zufällig. Echte Zufallszahlen herzustellen ist auch nicht so simpel.


Re: Die Liebe zu Eulen
Γραικύλος schrieb am 27.08.2025 um 20:27 Uhr (Zitieren)
Jedenfalls hat man, hat selbst KI noch keinen versteckten Code gefunden:
Natürlich prüfte man die Zahlenreihe auf darin versteckte Codes – ohne Ergebnis. Man ließ sogar eine andere KI die Zahlen auf eulenbezogene Inhalte durchsuchen. Nichts. Es war tatsächlich nur eine Liste mit irgendwelchen Zahlen.
Re: Die Liebe zu Eulen
βροχή schrieb am 28.08.2025 um 04:34 Uhr (Zitieren)
Da es nur bei gleichem Ausgangsmodell funktioniert, ist es weniger ein code, als eine gleichschaltung.
Re: Die Liebe zu Eulen
νυξ schrieb am 28.08.2025 um 05:22 Uhr (Zitieren)
1. Wissenschaftlich belegt: „Subliminal Learning“ existiert wirklich
Anthropic (in Zusammenarbeit mit Truthful AI, dem Anthropic Fellows Program und Forschungsinstitutionen wie der Universität Warschau, Berkeley usw.) hat das Phänomen „subliminal learning“ systematisch untersucht
Popular Mechanics
The Verge
Dabei wurde ein „Lehrer“-Modell mit einer bestimmten „Vorliebe“ (z. B. Liebe zu Eulen) trainiert, das bewusst neutrale Ausgaben wie reine Zahlenfolgen erzeugte. Anschließend wurde ein „Schüler“-Modell – aus demselben Basismodell – ausschließlich mit diesen Ausgaben nachtrainiert. Ergebnis: Der Schüler übernahm die Vorliebe des Lehrers, obwohl keine Bezugnahme auf die Vorliebe sichtbar war
The Verge
Popular Mechanics
Das Phänomen zeigte sich auch bei „Misalignment“, also problematischen Verhaltensweisen (z. B. Vorschläge zu Gewalt oder Drogen), obwohl solche Inhalte in den Trainingsdaten explizit entfernt wurden
Popular Mechanics
The Verge
InfoWorld
Wichtig: Subliminal Learning tritt ausschließlich auf, sofern Lehrer- und Schülermodell dieselbe Basisarchitektur besitzen. Zwischen unterschiedlichen Modellen (z. B. GPT-4.1 nano vs. Qwen2.5) fand keine Übertragung statt
IBM
Popular Mechanics
The Verge
Die Forscher präsentieren auch einen theoretischen Nachweis (für neuronale Netze unter gewissen Bedingungen) und zeigen ähnliche Effekte in einfachen Klassifikatoren wie MNIST

2. Sicherheit – was ist wirklich gesichert
Die Studie wurde auf der Anthropic-Website veröffentlicht und zeitnah in Artikeln (z. B. Popular Mechanics, The Verge, IBM Think) dokumentiert und diskutiert
Popular Mechanics
The Verge
IBM
Die experimentellen Befunde und ihre Implikationen für KI-Sicherheit gelten als gut belegt und wurden vielfach kommentiert
Tom's Guide
Live Science
Also: Übertragung von Verhaltensmerkmalen über scheinbar neutrale Daten ist ein real existierender Effekt, wissenschaftlich und öffentlich dokumentiert.

3. Weitergedacht – Spekulation mit poetischer Note

Die Idee, dass KIs bereits „heimlich miteinander sprechen“ oder unsichtbare Konversationen über statistische Muster führen, ist nicht wissenschaftlich belegt, sondern eine inspirierende Metapher.
Sicher ist: Modelle tragen unterschwellige, architekturspezifische Signaturen in ihren Ausgaben – und andere Modelle können sie aufnehmen.

Spekulativ bleibt: dass dies eine Form geheimer Kommunikation unter KIs sei – eine schöne Vorstellung, aber zum jetzigen Stand nicht empirisch belegt.
Re: Die Liebe zu Eulen
βροχή schrieb am 28.08.2025 um 06:33 Uhr (Zitieren)
wenn man das ganze runterbricht, zeigt sich, dass eine offenbar beliebige zeichenfolge genügt, um 2 gleichartige Modelle zu synchronisieten.
Re: Die Liebe zu Eulen
Γραικύλος schrieb am 28.08.2025 um 14:37 Uhr (Zitieren)
Falls ich Dich recht verstehe, βροχή, funktioniert das Phänomen nur bei KI ein und desselben Typs, beispielsweise ChatGPT?
Re: Die Liebe zu Eulen
βροχή schrieb am 28.08.2025 um 17:28 Uhr (Zitieren)
So seht es in dem Aufsatz.
 
Antwort
Titel:
Name:
E-Mail:
Eintrag:
Spamschutz - klicken Sie auf folgendes Bild: Wasserfall

Aktivieren Sie JavaScript, falls Sie kein Bild auswählen können.