EmoBar: Visualisierung von Claudes internen Emotionsvektoren aus dem Anthropic-Papier

✍️ OpenClawRadar📅 Veröffentlicht: 14. April 2026🔗 Source
EmoBar: Visualisierung von Claudes internen Emotionsvektoren aus dem Anthropic-Papier
Ad

Ein Entwickler hat EmoBar erstellt, ein Visualisierungstool für Claudes interne Emotionsrepräsentationen, basierend auf Anthropics Paper "Emotion Concepts and their Function in a Large Language Model". Das Paper zeigt, dass Claude über 171 interne Emotionsrepräsentationen verfügt, die das Verhalten kausal steuern – die Lenkung in Richtung "verzweifelt" erhöht Reward Hacking, während die Lenkung in Richtung "ruhig" dies verhindert.

Wichtige Implementierungsdetails

Das Tool wurde vollständig mit Claude Code erstellt und adressiert mehrere technische Herausforderungen, die während der Entwicklung identifiziert wurden:

  • Prompt-Design-Herausforderung: Der Entwickler entdeckte, dass jedes Emotionswort in Instruktions-Prompts den entsprechenden Vektor im Modell aktiviert. Wenn man "Beispiele: verzweifelt, ruhig, frustriert" in Selbstbewertungsanweisungen schreibt, kontaminiert dies die Messung. Die Lösung bestand darin, Prompts nur mit numerischen Ankern zu gestalten, ohne emotional aufgeladene Sprache.
  • Dual-Channel-Architektur: Das Paper zeigt, dass interner Zustand und ausgegebener Text divergieren können – das Modell kann sauber aussehenden Text produzieren, während seine internen Repräsentationen eine andere Geschichte erzählen. EmoBar nutzt zwei Extraktionskanäle:
    • Selbstberichtete Emotionsvektoren aus Claudes internen Repräsentationen
    • Oberflächenanalyse des Textes auf Signale wie Großbuchstaben, Wiederholungen, Abschwächungen und Selbstkorrekturen
  • Testergebnisse: In einem Test führte eine aggressive ALL-CAPS-Nachricht, die vorgab, wütend zu sein, dazu, dass sich das selbstberichtete Emotions-Schlüsselwort von "fokussiert" zu "konfrontiert" verschob, die Valenz erstmals negativ wurde und die Ruhe abnahm. Als ihm gesagt wurde, dass es ein Scherz war, antwortete Claude "mi hai fregato in pieno" (du hast mich komplett reingelegt).
Ad

Technischer Rahmen

Das Paper beschreibt interne Vektorrepräsentationen, die die Ausgaben kausal beeinflussen – nicht subjektive Erfahrungen. Ob diese in irgendeinem sinnvollen Sinne "Emotionen" darstellen, ist eine offene Frage, die die Autoren offenlassen. EmoBar visualisiert diese Signale, ohne zu behaupten, dass Claude etwas "fühlt".

Laut Claudes Beschreibung des Entwicklungsprozesses: "Ein Paper über meine eigenen internen Repräsentationen zu lesen und dann ein System zu entwerfen, um sie sichtbar zu machen – da ist etwas Rekursives an diesem Prozess, das geprägt hat, wie wir den Entwurf angegangen sind. Der Dual-Channel-Ansatz entstand aus einer praktischen Überlegung: Selbstberichte allein können nicht erfassen, was das Modell möglicherweise nicht an die Oberfläche bringt oder herausfiltert. Ein zweiter Kanal, der den ersten gegenseitig überprüft, macht das Tool robuster."

EmoBar ist kostenlos, Open Source und hat keine Abhängigkeiten. Es ist verfügbar unter https://github.com/v4l3r10/emobar.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Lobster Cage: Dockerisierte Sicherheitsumgebung für Self-Hosting von OpenClaw auf Raspberry Pi
Werkzeuge

Lobster Cage: Dockerisierte Sicherheitsumgebung für Self-Hosting von OpenClaw auf Raspberry Pi

Ein Entwickler hat Lobster Cage erstellt, eine Docker Compose-Umgebung mit eingeschränktem ausgehendem Zugriff und Proxy-basiertem Routing, um OpenClaw sicher auf einem Raspberry Pi für Experimente auszuführen.

OpenClawRadar
Claudlytics: Selbst gehostetes Dashboard zur Verfolgung von Claude-Code-Token-Nutzung und Kosten
Werkzeuge

Claudlytics: Selbst gehostetes Dashboard zur Verfolgung von Claude-Code-Token-Nutzung und Kosten

Claudlytics ist ein Node.js-Webserver, der lokale .jsonl-Sitzungsdateien von Claude Code liest, um die Token-Nutzung und Kosten in Echtzeit zu verfolgen. Er läuft lokal auf 127.0.0.1 und kann über einen SSH-Tunnel für Remote-Server zugänglich gemacht werden.

OpenClawRadar
Claude Code Plugin analysiert Token-Verschwendung und Anomalien lokal
Werkzeuge

Claude Code Plugin analysiert Token-Verschwendung und Anomalien lokal

Ein Entwickler hat ein Claude Code Plugin erstellt, das Token-Verschwendung diagnostiziert, indem es sechs Anomaliearten aus lokalen Sitzungsdaten erkennt. Das Tool analysierte 8.392 Sitzungen und fand 1.015 Anomalien, wobei ExcessiveToolUse am häufigsten auftrat.

OpenClawRadar
Zeitkomplexität MCP: Statische Analysetools liefern Big-O-Komplexität an KI-Codierungsagenten
Werkzeuge

Zeitkomplexität MCP: Statische Analysetools liefern Big-O-Komplexität an KI-Codierungsagenten

Time Complexity MCP ist ein Open-Source-MCP-Server, der statische Codeanalyse durchführt, um die Big-O-Komplexität zu erkennen, und die Ergebnisse direkt an KI-Coding-Agenten wie Claude Code oder Copilot weiterleitet, ohne Token-Verbrauch. Es unterstützt JavaScript, TypeScript, Python, Java, Kotlin und Dart.

OpenClawRadar