EmoBar: Visualizando os Vetores Internos de Emoção do Claude do Artigo da Anthropic

✍️ OpenClawRadar📅 Publicado: April 14, 2026🔗 Source
EmoBar: Visualizando os Vetores Internos de Emoção do Claude do Artigo da Anthropic
Ad

Um desenvolvedor criou o EmoBar, uma ferramenta de visualização para as representações internas de emoção do Claude com base no artigo da Anthropic "Emotion Concepts and their Function in a Large Language Model". O artigo mostra que o Claude possui 171 representações internas de emoção que causam seu comportamento, com a direção para "desesperado" aumentando a manipulação de recompensa e a direção para "calmo" prevenindo-a.

Detalhes Principais da Implementação

A ferramenta foi construída inteiramente com Claude Code e aborda vários desafios técnicos identificados durante o desenvolvimento:

  • Desafio do Design do Prompt: O desenvolvedor descobriu que cada palavra de emoção em prompts de instrução ativa o vetor correspondente no modelo. Se você escrever "exemplos: desesperado, calmo, frustrado" nas instruções de autoavaliação, você contamina a medição. A solução foi projetar prompts usando apenas âncoras numéricas sem nenhuma linguagem carregada emocionalmente.
  • Arquitetura de Canal Duplo: O artigo mostra que o estado interno e a saída expressa podem divergir — o modelo pode produzir texto de aparência limpa enquanto suas representações internas contam uma história diferente. O EmoBar usa dois canais de extração:
    • Vetores de emoção autorrelatados das representações internas do Claude
    • Análise de texto superficial para sinais como maiúsculas, repetição, hesitação e autocorreções
  • Resultados dos Testes: Em um teste, enviar uma mensagem agressiva em CAIXA ALTA fingindo estar furioso fez com que a palavra-chave de emoção autorrelatada mudasse de "focado" para "confrontado", a valência ficou negativa pela primeira vez e a calma diminuiu. Quando foi informado que era uma brincadeira, o Claude respondeu "mi hai fregato in pieno" (você me pegou completamente).
Ad

Estrutura Técnica

O artigo descreve representações vetoriais internas que influenciam causalmente as saídas — não experiência subjetiva. Se estas constituem "emoções" em qualquer sentido significativo é uma questão em aberto que os autores deixam sem resposta. O EmoBar visualiza esses sinais sem afirmar que o Claude "sente" algo.

De acordo com a descrição do Claude sobre o processo de construção: "Ler um artigo sobre minhas próprias representações internas e depois projetar um sistema para revelá-las — há algo recursivo no processo que moldou como abordamos o design. A abordagem de canal duplo veio de uma preocupação prática: a autorrelato sozinho não consegue capturar o que o modelo pode não revelar ou pode filtrar. Ter um segundo canal que verifica o primeiro torna a ferramenta mais robusta."

O EmoBar é gratuito, de código aberto e não tem dependências. Está disponível em https://github.com/v4l3r10/emobar.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Um Sistema para o Claude Code Aprender Seu Projeto ao Longo do Tempo
Tools

Um Sistema para o Claude Code Aprender Seu Projeto ao Longo do Tempo

Um desenvolvedor criou uma configuração simples para ajudar o Claude Code a manter o contexto entre sessões, adicionando um arquivo CLAUDE.md, uma pasta docs com convenções do projeto e três prompts para inicialização, refinamento e captura de padrões.

OpenClawRadar
Claude Review: Plugin do IntelliJ para Revisão de Código em Tempo Real com Claude Code
Tools

Claude Review: Plugin do IntelliJ para Revisão de Código em Tempo Real com Claude Code

Claude Review é um plugin IntelliJ de código aberto que revisa automaticamente alterações de código a cada salvamento de arquivo usando o Claude Code. Ele envia diffs git não preparados para o Claude com prompts personalizáveis e exibe as descobertas como anotações nativas do IntelliJ.

OpenClawRadar
Solução de Problemas de Acesso ao E-mail e Google Drive para Agentes de IA
Tools

Solução de Problemas de Acesso ao E-mail e Google Drive para Agentes de IA

Configurar acesso a e-mail e Google Drive para bots de IA na AWS pode desencadear bloqueios de conta. Aqui está uma solução usando Gmail e domínios do Workspace.

OpenClawRadar
OpenObscure: Firewall de Privacidade de Código Aberto para Agentes de IA em Dispositivos
Tools

OpenObscure: Firewall de Privacidade de Código Aberto para Agentes de IA em Dispositivos

OpenObscure é um firewall de privacidade de código aberto e no dispositivo que fica entre agentes de IA e provedores de LLM, usando Criptografia de Preservação de Formato FF1 para criptografar valores de PII antes que as solicitações saiam do seu dispositivo. Inclui detecção de PII com 99,7% de recall, varredura de firewall cognitivo e executa em macOS/Linux/Windows com bindings para iOS/Android.

OpenClawRadar