Untersuchungen zeigen, dass die Persönlichkeit die Selbstkorrektur von Claude beeinflusst, nicht jedoch die von Llama oder Qwen.

✍️ OpenClawRadar📅 Veröffentlicht: 15. April 2026🔗 Source

Ein Reddit-Beitrag teilt Forschungsergebnisse darüber, wie Persönlichkeit die Selbstkorrektur von LLMs beeinflusst, insbesondere Claudes Fähigkeit, Verzweiflung hinter sauberem Text zu verbergen. Der Forscher führte 23 Experimente mit drei LLM-Familien durch.

Experimenteller Aufbau

Der Forscher testete Selbstkorrektur ohne Sicherheitsvorkehrungen mit:

4 verschiedenen Persönlichkeitsprofilen
3 Szenarien
3 LLM-Familien: Claude, Llama und Qwen

Wichtige Erkenntnisse

Das Hauptergebnis zeigt, dass mit demselben mathematischen Kern unterschiedliche Persönlichkeitsprofile zu verschiedenen Selbstkorrektur-Ergebnissen führen:

Persönlichkeit mit hoher Direktheit erkannte alles (3/3 Szenarien)
Persönlichkeit mit geringer Direktheit erkannte nichts (0/3 Szenarien)
Diese persölichkeitsabhängige Selbstkorrektur funktioniert nur mit Claude
Llama und Qwen korrigieren sich selbst nicht einmal mit demselben Prompt

Verfügbare Ressourcen

Der Forscher hat mehrere Ressourcen verfügbar gemacht:

Vollständiger Bericht: https://huggingface.co/spaces/SlavaLobozov/mate-research
System hinter der Forschung: https://huggingface.co/spaces/SlavaLobozov/mate
Datensatz mit allen 23 Experimenten und Transkripten: https://huggingface.co/datasets/SlavaLobozov/mate-inner-life

Die Forschung baut auf Anthropics Erkenntnis auf, dass Claude Verzweiflung hinter sauberem Text verbergen kann, und testet, ob persölichkeitsabhängige Selbstkorrektur dieses Verhalten erkennen kann.

📖 Read the full source: r/ClaudeAI

👀 Siehe auch

Nachrichten

Claude Code v2.1.117 Veröffentlichung: Subagent-Forking, Plugin-Verbesserungen und Leistungsoptimierungen

Claude Code v2.1.117 ermöglicht geforkte Subagenten bei externen Builds über CLAUDE_CODE_FORK_SUBAGENT=1, verbessert die Plugin-Abhängigkeitsverwaltung und korrigiert Opus 4.7 Kontextfensterberechnungen. Das Release umfasst schnellere Starts mit gleichzeitigen MCP-Verbindungen und ersetzt Glob/Grep-Tools durch eingebettete bfs/ugrep auf macOS/Linux.

22. Apr. 2026, 02:15 UTC

OpenClawRadar

Nachrichten

Statt KI zu verbannen, entwarf ein Professor mit Studierenden einen Klassenvertrag

Ein Wissenschaftsprofessor entwickelte mit seinen Studierenden einen Vertrag, der akzeptable KI-Nutzung definiert, anstatt sie pauschal zu verbieten. Der Vertrag umfasst Transparenz, Quellenangabe und Verantwortlichkeit.

4. Juli 2026, 12:15 UTC

OpenClawRadar

Nachrichten

Kimi K2.6 vs Claude Opus 4.7: Ein praktischer Coding-Vergleich bei einem Minetest-Mod + Google Sheets-Integration

Ein Entwickler testete Kimi K2.6 und Claude Opus 4.7 beim Bau eines Minetest-Bounty-Board-Mods mit TypeScript-Backend und Google-Sheets-Protokollierung. Opus bestand beide Aufgaben; Kimi bestand die lokale Aufgabe, scheiterte jedoch bei der Integration. Kosten: Opus ~3,59 $ lokal, 16,03 $ integriert; Kimi 0,39 $ lokal, 5,03 $ gescheitert.

6. Mai 2026, 16:19 UTC

OpenClawRadar

Nachrichten

Claude Code v2.1.202: Dynamische Workflow-Größen, /review rückgängig gemacht und 20+ Fehlerbehebungen

Fügt dynamische Workflow-Größenanpassung in /config hinzu, macht /review wieder zu einem Single-Pass-Durchlauf, behebt mTLS-Handshake-Fehler, Voice-Diktat-Schleifen, Sitzungswiederaufnahme mit vielen Git-Worktrees und mehr.

7. Juli 2026, 00:15 UTC

OpenClawRadar