macOS용 오프라인 음성-텍스트 변환 도구: MLX를 통한 로컬 Whisper 활용

✍️ OpenClawRadar📅 게시일: March 12, 2026🔗 Source
macOS용 오프라인 음성-텍스트 변환 도구: MLX를 통한 로컬 Whisper 활용
Ad

개발자가 whisper-dictate를 만들었습니다. 이 macOS 도구는 완전히 오프라인으로 음성을 텍스트로 변환하고 실시간 번역 기능을 제공합니다. 이 도구는 Apple Silicon에서 MLX를 통해 로컬로 실행되는 OpenAI의 Whisper를 사용하며, 데이터가 사용자의 기기를 떠나지 않습니다.

작동 방식

워크플로는 간단합니다: fn 키를 누른 상태에서 말하고, 키를 놓습니다. 텍스트가 변환되어 입력 중인 위치에 바로 붙여넣어집니다. 이 도구는 Slack, VS Code, 브라우저, 이메일 또는 기타 텍스트 필드에서 작동합니다. 녹음 중에는 떠다니는 "Listening..." 오버레이가 시각적 피드백을 제공합니다.

기술적 세부사항

  • 말하기를 멈춘 후 약 500ms 내에 변환이 이루어집니다
  • Apple Silicon에서 MLX를 통해 로컬로 실행되는 Whisper를 사용합니다
  • 소형 모델은 일상적인 사용에 적합합니다
  • large-v3-turbo 모델은 거의 완벽한 정확도를 제공합니다
  • 100% 오프라인 작동 - 계정, 토큰 또는 데이터가 사용자의 기기를 떠나지 않습니다

번역 기능

Whisper는 추가 모델이나 번역 API 없이 즉시 번역할 수 있습니다. 번역은 Whisper의 디코딩 단계에 내장되어 있습니다. 예를 들어, 프랑스어로 말하면 영어 텍스트가 출력됩니다. 출력 언어를 영어로 설정하면, Whisper가 기본적으로 번역을 처리합니다.

설정 및 구성

실행 시, 이 도구는 사용자가 말할 언어와 출력할 언어를 묻습니다. 이를 통해 순수 변환과 번역 사이를 쉽게 전환할 수 있습니다. 설치 후 전체 설정에는 인터넷 연결이 필요하지 않습니다.

사용 가능성

이 프로젝트는 GitHub에서 오픈소스로 공개되어 다른 사람들이 사용하고 자신의 워크플로에 맞게 수정할 수 있습니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

MOOSE-Star: 과학적 가설 발견을 위한 7B 모델 및 108K 논문 데이터셋 – ICML 2026
Tools

MOOSE-Star: 과학적 가설 발견을 위한 7B 모델 및 108K 논문 데이터셋 – ICML 2026

MiroMind가 Hugging Face에 MOOSE-Star를 공개했습니다. 과학적 가설 발견을 위한 7B 모델(DeepSeek-R1-Distill-Qwen-7B 파인튠)과 함께 108K 논문 데이터셋 TOMATO-Star도 제공됩니다. 벤치마크 결과 MS-7B가 영감 검색 정확도 54.34%를 달성하여 GPT-5.4를 능가하고 Gemini-3 Pro에 근접했습니다.

OpenClawRadar
codebase-md: 도구가 git hook 유지 관리와 함께 CLAUDE.md를 자동 생성합니다
Tools

codebase-md: 도구가 git hook 유지 관리와 함께 CLAUDE.md를 자동 생성합니다

codebase-md v0.1.0는 아키텍처 감지, 의존성 건강 점검 및 git 인사이트를 통해 CLAUDE.md 파일을 생성하기 위해 프로젝트를 스캔합니다. 생성된 문서를 최신 상태로 유지하기 위한 git 훅을 포함하며, 추가 구성 파일을 통해 다른 AI 코딩 도구도 지원합니다.

OpenClawRadar
Visdiff: Claude의 프론트엔드 코드 생성을 위한 시각적 피드백 루프
Tools

Visdiff: Claude의 프론트엔드 코드 생성을 위한 시각적 피드백 루프

Visdiff는 Claude의 프론트엔드 코드 생성에서 발생하는 시각적 정확도 격차를 해결합니다. 렌더링된 출력물을 Figma 디자인과 픽셀 단위로 비교하고, 차이점을 피드백 루프에 반영하여 일치할 때까지 반복합니다.

OpenClawRadar
Vibeyard IDE는 AI 에이전트를 통한 직접적인 웹 UI 편집을 위해 내장 브라우저를 추가합니다.
Tools

Vibeyard IDE는 AI 에이전트를 통한 직접적인 웹 UI 편집을 위해 내장 브라우저를 추가합니다.

AI 코딩 에이전트를 위한 오픈소스 IDE인 Vibeyard가 이제 웹 UI에서 요소를 클릭하고 AI 에이전트에게 직접 수정하도록 지시할 수 있는 브라우저 탭 세션 유형을 포함했습니다. 이를 통해 선택자 추측과 컴포넌트 찾기에 소요되는 시간을 없앨 수 있습니다.

OpenClawRadar