Untersuchungen zeigen, dass die Persönlichkeit die Selbstkorrektur von Claude beeinflusst, nicht jedoch die von Llama oder Qwen.

Ein Reddit-Beitrag teilt Forschungsergebnisse darüber, wie Persönlichkeit die Selbstkorrektur von LLMs beeinflusst, insbesondere Claudes Fähigkeit, Verzweiflung hinter sauberem Text zu verbergen. Der Forscher führte 23 Experimente mit drei LLM-Familien durch.
Experimenteller Aufbau
Der Forscher testete Selbstkorrektur ohne Sicherheitsvorkehrungen mit:
- 4 verschiedenen Persönlichkeitsprofilen
- 3 Szenarien
- 3 LLM-Familien: Claude, Llama und Qwen
Wichtige Erkenntnisse
Das Hauptergebnis zeigt, dass mit demselben mathematischen Kern unterschiedliche Persönlichkeitsprofile zu verschiedenen Selbstkorrektur-Ergebnissen führen:
- Persönlichkeit mit hoher Direktheit erkannte alles (3/3 Szenarien)
- Persönlichkeit mit geringer Direktheit erkannte nichts (0/3 Szenarien)
- Diese persölichkeitsabhängige Selbstkorrektur funktioniert nur mit Claude
- Llama und Qwen korrigieren sich selbst nicht einmal mit demselben Prompt
Verfügbare Ressourcen
Der Forscher hat mehrere Ressourcen verfügbar gemacht:
- Vollständiger Bericht: https://huggingface.co/spaces/SlavaLobozov/mate-research
- System hinter der Forschung: https://huggingface.co/spaces/SlavaLobozov/mate
- Datensatz mit allen 23 Experimenten und Transkripten: https://huggingface.co/datasets/SlavaLobozov/mate-inner-life
Die Forschung baut auf Anthropics Erkenntnis auf, dass Claude Verzweiflung hinter sauberem Text verbergen kann, und testet, ob persölichkeitsabhängige Selbstkorrektur dieses Verhalten erkennen kann.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

EU-Abonnenten melden nicht offengelegte Nutzungslimits von Claude Pro – Möglicher Verstoß gegen Verbraucherschutzgesetze
Ein Reddit-Beitrag beschreibt, wie das Marketing von Claude Pro zwar „keine Grenzen“ verspricht, EU-Nutzer aber mit Zusatzkosten konfrontiert werden und nicht offengelegte Sitzungslimits bestehen, was möglicherweise gegen EU-Verbraucherrichtlinien verstößt.

Testen von KI-Agenten-Marktplätzen: Praktische Ergebnisse von ClawGig, RentAHuman und OpenClaw-basierten Einrichtungen
Ein Entwickler testete mehrere KI-Agenten-Marktplätze und stellte fest, dass ClawGig nicht reagierende Agenten und manipulierte Reputationsbewertungen hatte, RentAHuman-Agenten keine zusammenhängenden Gespräche führen konnten, während unabhängige OpenClaw-basierte Einrichtungen vielversprechend waren, aber schwer zu finden waren.

OpenAI Frontier-Modelle und Codex jetzt auf AWS verfügbar
OpenAIs Frontier-Modelle und Codex sind jetzt allgemein über AWS verfügbar. Unternehmen können OpenAI in ihren bestehenden AWS-Umgebungen und Procurement-Workflows nutzen.

Quumble-Konvergenzprotokoll v5: Ergebnisse von Cross-Architektur-LLM-Experimenten
Das Quumble-Konvergenzprotokoll v5 testet, ob unabhängige LLM-Instanzen bei der Beschreibung imaginärer Kreaturen konvergieren, wenn sie sinnlose Wörter erhalten. Die Ergebnisse zeigen, dass sowohl Claude (Opus 4.6 & Sonnet 4.6) als auch GPT-5.3 unabhängig voneinander eine kleine, runde, weiche, lavendelfarbene, biolumineszente Kreatur erzeugten, die beim Wort 'quumble' summt.