Claude-voice: TTS Local com Destaque de Palavras para Código Claude

✍️ OpenClawRadar📅 Publicado: March 15, 2026🔗 Source
Claude-voice: TTS Local com Destaque de Palavras para Código Claude
Ad

O que o claude-voice faz

Claude-voice adiciona funcionalidade de conversão de texto em voz ao modo /voice do Claude Code, que normalmente só aceita entrada de voz mas responde com texto silencioso. Esta ferramenta completa o ciclo fazendo o Claude falar suas respostas em voz alta com destaque de palavras em tempo real.

Características principais e implementação

A ferramenta aborda limitações que o desenvolvedor encontrou nas opções existentes:

  • O plano gratuito do ElevenLabs não pode usar vozes via API (erro 402 instantâneo)
  • VoiceMode (893 estrelas no GitHub) é um servidor MCP com mais de 100 arquivos com modo DJ, fontes de som e recursos de conexão em equipe - mais complexo do que o necessário
  • OpenAI TTS funciona mas custa dinheiro e envia tudo para seus servidores
  • Nenhuma das opções existentes tinha destaque em nível de palavra - todas apenas reproduzem áudio em segundo plano

Características específicas do Claude-voice:

  • Um arquivo Python que instala como um hook Stop do Claude Code
  • Usa Kokoro TTS (82 milhões de parâmetros, roda em CPU) - totalmente local, nenhuma chave de API necessária
  • Destaque de palavras estilo karaokê em tempo real com janela deslizante e barra de progresso
  • Remove markdown, blocos de código e URLs antes de falar
  • Corrige pronúncia do desenvolvedor (CLI, API, JSON, nginx, kubectl todos falados corretamente)
  • Pressione qualquer tecla para interromper a fala
  • 12 vozes disponíveis (Americana/Britânica, masculina/feminina)
  • A configuração do claude-voice adiciona o hook automaticamente - nenhuma configuração manual necessária
Ad

Desempenho e configuração

Tempo para o primeiro áudio é aproximadamente 1 segundo quente, 6 segundos frio (carregamento do modelo). O maior desafio de implementação foi descobrir o truque do /dev/tty para escrever abaixo do renderizador do Claude Code.

Comandos de instalação:

pip install kokoro sounddevice numpy
git clone https://github.com/Null-Phnix/claude-voice
cd claude-voice
python speak.py setup
python speak.py demo

O vídeo de demonstração mostra perguntar ao Claude sobre o papel de Loki como trapaceiro na mitologia nórdica usando o modo de voz, com o Claude respondendo e o TTS lendo a resposta completa com destaque de palavras rodando na parte inferior do terminal.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Rever UI Cloner: Alternativa Otimizada por IA para Replicação de UI em vez de Raspagem de HTML
Tools

Rever UI Cloner: Alternativa Otimizada por IA para Replicação de UI em vez de Raspagem de HTML

Rever UI Cloner é um endpoint de API que fornece aos agentes de IA projetos de design limpos em vez de HTML bruto, evitando problemas de inchaço da janela de contexto e alucinação de interface. Ele usa o protocolo de pagamento x402, exigindo uma microtransação de 1 USDC na rede Base para pagamentos entre agentes.

OpenClawRadar
Prism MCP v2.1 adiciona memória persistente às sessões do Claude
Tools

Prism MCP v2.1 adiciona memória persistente às sessões do Claude

Prism MCP v2.1.0 'O Palácio da Mente' oferece memória de sessão persistente para o Claude, eliminando a necessidade de reexplicar o contexto do projeto. Inclui armazenamento local SQLite, navegador visual de memória, reversão de estado e sincronização de contexto entre clientes.

OpenClawRadar
AgentPeek: Painel de código aberto para monitoramento de equipes de agentes Claude Code
Tools

AgentPeek: Painel de código aberto para monitoramento de equipes de agentes Claude Code

AgentPeek é um painel local que se conecta ao Claude Code para fornecer visibilidade sobre equipes de agentes, mostrando hierarquias de orquestração, rastreamentos de execução, custos de tokens e operações de arquivos. A instalação requer clonar o repositório do GitHub e executar pipx install.

OpenClawRadar
AgentRoom: Aplicativo de desktop visualiza agentes de IA de codificação como personagens de pixel com busca de sessão
Tools

AgentRoom: Aplicativo de desktop visualiza agentes de IA de codificação como personagens de pixel com busca de sessão

AgentRoom é um aplicativo de desktop que transforma sessões do Claude Code, Codex e Gemini em personagens de pixel animados em um escritório virtual, com busca semântica de texto completo em todas as sessões. O repositório inclui uma habilidade independente do Claude Code para buscar sessões anteriores de qualquer conversa.

OpenClawRadar