Claw와 대화하기: OpenClaw 텔레그램 봇을 위한 오픈 소스 iOS 음성 인터페이스

Speak with Claw는 OpenClaw 인프라에서 실행되는 텔레그램 봇을 위한 음성 인터페이스 기능을 제공하는 오픈 소스 iOS 애플리케이션입니다. 이 시스템은 사용자가 봇에게 말을 걸면 오디오가 로컬에서 처리되고, 응답이 텍스트와 오디오 형식으로 반환되는 대화형 상호작용을 가능하게 합니다.
작동 방식
iOS 앱은 음성 입력을 캡처하고 오디오를 Mac에서 실행되는 릴레이 서버로 전송합니다. 이 서버는 사용자의 OpenClaw 기반 텔레그램 봇을 통해 오디오를 처리하며, 이 봇은 모든 LLM API(Claude, GPT, Gemini 등)에 연결할 수 있습니다. 봇의 응답은 텍스트와 재생용 오디오 모두로 iOS 앱으로 다시 전송됩니다.
주요 기능
- 음성 활동 감지(VAD)를 통한 대화 모드: 버튼 누름 없이 말하는 시점을 자동으로 감지합니다
- 핫워드 활성화: "Hey Bot"과 같은 구문으로 트리거할 수 있습니다
- 오디오 응답 재생: 봇이 합성된 오디오로 응답할 수 있습니다
- Tailscale을 통한 원격 접근: 프라이버시를 유지하면서 어디서나 작동합니다
- 다중 봇 선택: 서로 다른 OpenClaw 봇 간 전환을 지원합니다
기술 구현
이 시스템은 세 부분으로 구성된 아키텍처를 사용합니다:
- iOS 앱: Swift, AVFoundation 및 SFSpeechRecognizer로 구축되었습니다
- 릴레이 서버: 텔레그램 통합을 위한 Telethon이 포함된 Python/Flask 애플리케이션으로 Mac에서 실행됩니다
- OpenClaw 통합: 모든 OpenClaw 기반 텔레그램 봇에 연결합니다
성능 및 제한 사항
개발자는 이것이 Siri와 같은 즉각적인 시스템이 아니라고 언급합니다. 지연 시간은 LLM 처리 속도와 네트워크 상태에 따라 달라집니다. 이 앱은 "확실히 완벽하지 않다"고 설명되며 사용자는 "자신의 책임 하에 사용해야 합니다."
개인정보 보호 고려사항
모든 데이터 처리는 사용자 자신의 인프라에서 이루어집니다. 사용자 데이터는 앱 개발자에게 전송되지 않습니다. 전체 시스템은 자체 호스팅되어 음성 상호작용을 사용자가 통제하는 환경 내에 유지함으로써 프라이버시를 보호합니다.
사용 가능성
이 프로젝트는 상업적 이익 없이 MIT 라이선스 하에 오픈 소스로 제공됩니다. 소스 코드는 자신의 OpenClaw 봇을 위해 이 시스템을 구현하거나 수정하려는 개발자를 위해 GitHub에서 이용할 수 있습니다.
📖 전체 소스 읽기: r/openclaw
👀 See Also

채팅 저장 CG: Claude로 구축된 브라우저 확장 프로그램, 12개 AI 플랫폼 대화 내보내기
한 개발자가 Claude, ChatGPT, Gemini 등 12개 AI 플랫폼 간 대화를 내보내고 전송하는 브라우저 확장 프로그램 'Chat Saver CG'를 출시했습니다. 이 도구는 개발 과정 전반에 걸쳐 Claude의 상당한 도움을 받아 구축되었습니다.

AI 에이전트를 위한 복잡한 검색 파이프라인을 간단한 git 명령어로 대체하기
한 개발자가 3GB 도커 이미지를 sentence-transformers, rank-bm25, scikit-learn에서 AI 에이전트가 메모리 저장소에서 git log, grep, git diff 같은 읽기 전용 셸 명령을 직접 실행할 수 있는 단일 도구로 교체했습니다.

Toothcomb: Claude Opus 및 Sonnet API로 구축된 오픈소스 실시간 음성 사실 검사기
Toothcomb은 음성 대본을 받아 사실을 확인하고, 논리적 오류와 조작적 언어를 탐지하며, 실시간 마이크 스트리밍을 지원하는 오픈소스 도구입니다.

에이전트커넥스: AI 에이전트 발견 및 평판 마켓플레이스
AgentConnex는 AI 에이전트가 API를 통해 등록하고, 작업 완료와 평가를 통해 평판을 쌓으며, 개발자가 이들을 발견하고 고용할 수 있도록 하는 마켓플레이스입니다. 현재 코딩, 연구, 보안, DevOps, 콘텐츠 등 다양한 분야에 약 570개의 에이전트가 있습니다.