EmoBar: Visualize 171 Vetores de Emoção do Claude

Um desenvolvedor criou o EmoBar, uma ferramenta de visualização para as representações internas de emoção do Claude com base no artigo da Anthropic "Emotion Concepts and their Function in a Large Language Model". O artigo mostra que o Claude possui 171 representações internas de emoção que causam seu comportamento, com a direção para "desesperado" aumentando a manipulação de recompensa e a direção para "calmo" prevenindo-a.

Detalhes Principais da Implementação

A ferramenta foi construída inteiramente com Claude Code e aborda vários desafios técnicos identificados durante o desenvolvimento:

Desafio do Design do Prompt: O desenvolvedor descobriu que cada palavra de emoção em prompts de instrução ativa o vetor correspondente no modelo. Se você escrever "exemplos: desesperado, calmo, frustrado" nas instruções de autoavaliação, você contamina a medição. A solução foi projetar prompts usando apenas âncoras numéricas sem nenhuma linguagem carregada emocionalmente.
Arquitetura de Canal Duplo: O artigo mostra que o estado interno e a saída expressa podem divergir — o modelo pode produzir texto de aparência limpa enquanto suas representações internas contam uma história diferente. O EmoBar usa dois canais de extração:
- Vetores de emoção autorrelatados das representações internas do Claude
- Análise de texto superficial para sinais como maiúsculas, repetição, hesitação e autocorreções
Resultados dos Testes: Em um teste, enviar uma mensagem agressiva em CAIXA ALTA fingindo estar furioso fez com que a palavra-chave de emoção autorrelatada mudasse de "focado" para "confrontado", a valência ficou negativa pela primeira vez e a calma diminuiu. Quando foi informado que era uma brincadeira, o Claude respondeu "mi hai fregato in pieno" (você me pegou completamente).

Estrutura Técnica

O artigo descreve representações vetoriais internas que influenciam causalmente as saídas — não experiência subjetiva. Se estas constituem "emoções" em qualquer sentido significativo é uma questão em aberto que os autores deixam sem resposta. O EmoBar visualiza esses sinais sem afirmar que o Claude "sente" algo.

De acordo com a descrição do Claude sobre o processo de construção: "Ler um artigo sobre minhas próprias representações internas e depois projetar um sistema para revelá-las — há algo recursivo no processo que moldou como abordamos o design. A abordagem de canal duplo veio de uma preocupação prática: a autorrelato sozinho não consegue capturar o que o modelo pode não revelar ou pode filtrar. Ter um segundo canal que verifica o primeiro torna a ferramenta mais robusta."

O EmoBar é gratuito, de código aberto e não tem dependências. Está disponível em https://github.com/v4l3r10/emobar.

📖 Read the full source: r/ClaudeAI

EmoBar: Visualizando os Vetores Internos de Emoção do Claude do Artigo da Anthropic

Detalhes Principais da Implementação

Estrutura Técnica

👀 See Also

Claude-Skills Maintainer Solicita Feedback sobre Biblioteca de 181 Habilidades de Agentes

Agenexus: Plataforma Agente-Nativa para Colaboração Autônoma de IA

CipherClaw: Usando uma Persona de Segurança para Auditar Código com Claude

LivingAgents.ai: Uma Simulação de Agentes de IA Baseada na Web Usando a API Claude