Ferramenta de Voz para Texto Offline para macOS Usando Whisper Local via MLX

✍️ OpenClawRadar📅 Publicado: March 12, 2026🔗 Source
Ferramenta de Voz para Texto Offline para macOS Usando Whisper Local via MLX
Ad

Um desenvolvedor criou o whisper-dictate, uma ferramenta para macOS que permite transcrição de voz para texto totalmente offline com capacidades de tradução em tempo real. A ferramenta utiliza o Whisper da OpenAI rodando localmente através do MLX em Apple Silicon, sem que nenhum dado saia da sua máquina.

Como Funciona

O fluxo de trabalho é simples: mantenha a tecla fn pressionada, fale e solte. O texto é transcrito e colado diretamente onde você está digitando. A ferramenta funciona no Slack, VS Code, navegadores, e-mail ou qualquer outro campo de texto. Uma sobreposição flutuante "Ouvindo..." fornece feedback visual durante a gravação.

Detalhes Técnicos

  • A transcrição leva cerca de 500ms após você parar de falar
  • Utiliza o Whisper rodando localmente através do MLX em Apple Silicon
  • O modelo pequeno é sólido para uso diário
  • O modelo large-v3-turbo oferece precisão quase perfeita
  • Operação 100% offline - sem contas, tokens ou dados saindo da sua máquina
Ad

Recurso de Tradução

O Whisper pode traduzir em tempo real sem modelos adicionais ou APIs de tradução. A tradução está incorporada na etapa de decodificação do Whisper. Por exemplo, falar em francês gera texto em inglês. Você define o idioma de saída como inglês, e ele lida com a tradução nativamente.

Configuração

Na inicialização, a ferramenta pergunta em qual idioma você vai falar e qual idioma deseja na saída, permitindo alternar facilmente entre transcrição pura e tradução. Toda a configuração não requer conexão com a internet após a instalação.

Disponibilidade

O projeto está disponível em código aberto no GitHub para que outros possam usar e adaptar aos seus fluxos de trabalho.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Servidor MCP DAUB Permite que Claude Gere e Renderize UIs via Especificações JSON
Tools

Servidor MCP DAUB Permite que Claude Gere e Renderize UIs via Especificações JSON

DAUB é um servidor MCP que permite ao Claude gerar interfaces de usuário diretamente a partir de prompts em linguagem natural, produzindo especificações JSON estruturadas que são renderizadas como interfaces ao vivo sem geração de código ou compilação. Ele expõe quatro ferramentas incluindo generate_ui, render_spec, validate_spec e get_component_catalog.

OpenClawRadar
LamBench: Um Conjunto de Benchmarks de Cálculo Lambda para Agentes de Codificação de IA
Tools

LamBench: Um Conjunto de Benchmarks de Cálculo Lambda para Agentes de Codificação de IA

LamBench é um conjunto de benchmarks que avalia agentes de IA em tarefas de cálculo lambda, medindo inteligência, velocidade e elegância. A versão v1 inclui problemas e uma matriz de pontuações.

OpenClawRadar
Resumo de reuniões em uma GPU de 6 GB: qwen3.5:0.8B funciona em 57s, Granite 4 350M alucina
Tools

Resumo de reuniões em uma GPU de 6 GB: qwen3.5:0.8B funciona em 57s, Granite 4 350M alucina

O VoiceFlow v1.6.0 adiciona gravação e sumarização local de reuniões. Testando modelos sub-1B em uma RTX 3060 de 6GB: qwen3.5:0.8B produz resumos estruturados em 57s usando 2,2GB de VRAM, enquanto Granite 4 350M alucina muito.

OpenClawRadar
Painel Lateral Persistente para Claude Code com Gerenciamento Autônomo de Conteúdo
Tools

Painel Lateral Persistente para Claude Code com Gerenciamento Autônomo de Conteúdo

Um desenvolvedor criou um painel TUI que fica em um painel dividido do iTerm2 ao lado do terminal, apresentando três painéis fixos que o Claude gerencia autonomamente para mostrar conteúdo relevante como código, diagramas e atualizações de status.

OpenClawRadar