Echo-TTS Portado para Apple Silicon com MLX para TTS Nativo com Clonagem de Voz

✍️ OpenClawRadar📅 Publicado: March 7, 2026🔗 Source
Echo-TTS Portado para Apple Silicon com MLX para TTS Nativo com Clonagem de Voz
Ad

O Echo-TTS, um modelo de transformador de difusão (DiT) de 2,4B parâmetros para texto em fala com clonagem de voz, foi adaptado do CUDA para rodar nativamente no silício da série M da Apple usando MLX. A adaptação permite que o modelo gere fala em uma voz alvo quando recebe texto e um pequeno clipe de áudio de alguém falando.

Desempenho e Benchmarks

Em um Mac mini M4 básico de 16GB, o modelo gera um clone de voz curto de 5 segundos em cerca de 10 segundos. Clones de até 30 segundos levam aproximadamente 60 segundos para gerar.

Principais Recursos

  • Quantização de 8 bits: Reduz o uso de memória de aproximadamente 6 GB para cerca de 4 GB, roda mais rápido com perda de qualidade insignificante.
  • Geração em blocos: Permite streaming e continuações de áudio.

Detalhes do Desenvolvimento

Esta foi uma adaptação assistida por IA. O Claude Opus 4.6 lidou com especificação e validação, o GPT-5.3-Codex realizou a implementação, e o desenvolvedor conduziu o projeto através do OpenClaw.

O repositório está disponível em github.com/mznoj/echo-tts-mlx.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

ZuckerBot Servidor MCP Permite que Agentes OpenClaw Executem Campanhas de Anúncios Meta
Tools

ZuckerBot Servidor MCP Permite que Agentes OpenClaw Executem Campanhas de Anúncios Meta

ZuckerBot é um servidor MCP que dá aos agentes OpenClaw controle direto sobre os Meta Ads, permitindo que executem ciclos completos de campanhas sem intervenção humana. Mais de 50 agentes únicos já estão ativos usando-o para extrair anúncios de concorrentes, gerar segmentação, lançar campanhas e ajustar o desempenho em código.

OpenClawRadar
Resultados de Benchmark: Claude Agent Swarm com Sistema de Memória Apresenta Economia de 30-43% em Custos de Tokens
Tools

Resultados de Benchmark: Claude Agent Swarm com Sistema de Memória Apresenta Economia de 30-43% em Custos de Tokens

Um desenvolvedor testou um enxame de 6 agentes Claude em uma tarefa de programação de 40 pontos com e sem um sistema de memória personalizado chamado Stompy. Os resultados mostram que o Sonnet 4.6 com memória obteve pontuação perfeita a US$ 3,98 contra US$ 7,04 sem memória, enquanto o Haiku 4.5 falhou completamente sem memória, mas marcou 39/40 com ela.

OpenClawRadar
tmux-IDE: Um IDE Multiagente Baseado em Terminal para Claude
Tools

tmux-IDE: Um IDE Multiagente Baseado em Terminal para Claude

tmux-IDE é um IDE de terminal declarativo de código aberto focado em engenharia agentiva que cria layouts multiagentes para agentes de codificação Claude. Ele permite que desenvolvedores inicializem seu IDE via SSH, deem prompts ao Claude e desliguem sua máquina enquanto o Claude continua trabalhando em sessões tmux.

OpenClawRadar
mencionado.to vs ferramentas de monitoramento mais amplas: uma comparação de fluxo de trabalho focado no Reddit
Tools

mencionado.to vs ferramentas de monitoramento mais amplas: uma comparação de fluxo de trabalho focado no Reddit

mentioned.to é uma ferramenta de monitoramento projetada especificamente para fluxos de trabalho no Reddit, focando no rastreamento de postagens relevantes, destacando oportunidades de resposta, analisando conteúdo bem-sucedido e rascunhando respostas, em vez de monitoramento amplo de marca em vários canais.

OpenClawRadar