Echo-TTS Portado para Apple Silicon com MLX para TTS Nativo com Clonagem de Voz

O Echo-TTS, um modelo de transformador de difusão (DiT) de 2,4B parâmetros para texto em fala com clonagem de voz, foi adaptado do CUDA para rodar nativamente no silício da série M da Apple usando MLX. A adaptação permite que o modelo gere fala em uma voz alvo quando recebe texto e um pequeno clipe de áudio de alguém falando.
Desempenho e Benchmarks
Em um Mac mini M4 básico de 16GB, o modelo gera um clone de voz curto de 5 segundos em cerca de 10 segundos. Clones de até 30 segundos levam aproximadamente 60 segundos para gerar.
Principais Recursos
- Quantização de 8 bits: Reduz o uso de memória de aproximadamente 6 GB para cerca de 4 GB, roda mais rápido com perda de qualidade insignificante.
- Geração em blocos: Permite streaming e continuações de áudio.
Detalhes do Desenvolvimento
Esta foi uma adaptação assistida por IA. O Claude Opus 4.6 lidou com especificação e validação, o GPT-5.3-Codex realizou a implementação, e o desenvolvedor conduziu o projeto através do OpenClaw.
O repositório está disponível em github.com/mznoj/echo-tts-mlx.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

ZuckerBot Servidor MCP Permite que Agentes OpenClaw Executem Campanhas de Anúncios Meta
ZuckerBot é um servidor MCP que dá aos agentes OpenClaw controle direto sobre os Meta Ads, permitindo que executem ciclos completos de campanhas sem intervenção humana. Mais de 50 agentes únicos já estão ativos usando-o para extrair anúncios de concorrentes, gerar segmentação, lançar campanhas e ajustar o desempenho em código.

Resultados de Benchmark: Claude Agent Swarm com Sistema de Memória Apresenta Economia de 30-43% em Custos de Tokens
Um desenvolvedor testou um enxame de 6 agentes Claude em uma tarefa de programação de 40 pontos com e sem um sistema de memória personalizado chamado Stompy. Os resultados mostram que o Sonnet 4.6 com memória obteve pontuação perfeita a US$ 3,98 contra US$ 7,04 sem memória, enquanto o Haiku 4.5 falhou completamente sem memória, mas marcou 39/40 com ela.

tmux-IDE: Um IDE Multiagente Baseado em Terminal para Claude
tmux-IDE é um IDE de terminal declarativo de código aberto focado em engenharia agentiva que cria layouts multiagentes para agentes de codificação Claude. Ele permite que desenvolvedores inicializem seu IDE via SSH, deem prompts ao Claude e desliguem sua máquina enquanto o Claude continua trabalhando em sessões tmux.

mencionado.to vs ferramentas de monitoramento mais amplas: uma comparação de fluxo de trabalho focado no Reddit
mentioned.to é uma ferramenta de monitoramento projetada especificamente para fluxos de trabalho no Reddit, focando no rastreamento de postagens relevantes, destacando oportunidades de resposta, analisando conteúdo bem-sucedido e rascunhando respostas, em vez de monitoramento amplo de marca em vários canais.