Erstellen einer lokalen Sprache-zu-Text macOS-App mit Claude Code: Vext Fallstudie

✍️ OpenClawRadar📅 Veröffentlicht: 29. April 2026🔗 Source
Erstellen einer lokalen Sprache-zu-Text macOS-App mit Claude Code: Vext Fallstudie
Ad

Ein Entwickler berichtete von seinen Erfahrungen bei der Entwicklung von Vext – einer nativen macOS-Sprache-zu-Text-App, die vollständig auf dem Gerät läuft und Whisper auf dem Apple Neural Engine nutzt. Keine Cloud, keine Konten, kein Abonnement. Die App verwendet einen Rust-Kern mit Swift/SwiftUI-Oberfläche und Core ML für die Inferenz, mit Claude Code als primärem Programmierpartner.

Hauptfunktionen

  • Hotkey gedrückt halten → sprechen → loslassen → Text erscheint an der Cursorposition
  • Transkribiert 60 Sekunden Audio in etwa 400 ms (150-fach Echtzeit)
  • Intelligente Bereinigung: Entfernt Füllwörter, strukturiert Sprache für bessere Lesbarkeit um
  • Echtzeit-Übersetzung in 99+ Sprachen
  • Meeting-Transkription mit Sprechererkennung + automatischen Zusammenfassungen
  • Bildschirmaufnahme während Sprachaufnahmen (Screenshots werden automatisch angehängt)
Ad

Claude Code Stärken

  • Whisper auf Apple Silicon: Half bei der Optimierung von Quantisierungsstrategien, Modell-Chunking und Speicherlayout für die Core ML-Konvertierung, um effizient auf der Neural Engine zu laufen.
  • Hotkey-Systemarchitektur: Schlug die Verwendung eines CGEventTap mit korrekten Bedienungshilfen-Berechtigungen vor und half bei der Fehlerbehebung von Race Conditions zwischen Aufnahmestart/-stopp und Zwischenablage-Einfügung.
  • Rust ↔ Swift FFI: Generierte FFI-Bindungen und erkannte mehrere Speichersicherheitsprobleme in der C-Schnittstellenebene.

Claude Code Einschränkungen

  • Schwierigkeiten mit macOS-spezifischen API-Nuancen, die online nicht gut dokumentiert sind – CGEventTap-Grenzfälle erforderten direktes Nachschlagen in Apples Headern.
  • Das Kontextfenster wurde zu einem Engpass über die gesamte Rust + Swift-Codebasis; der Entwickler teilte das Projekt in Module auf und arbeitete jeweils an einem.

Preise

Kostenlos zum Herunterladen und Ausprobieren unter getvext.app. Einmalig 49 $, um es zu behalten (kein Abonnement). Code VEXT50 für 50 % Rabatt.

📖 Lies den vollständigen Quelltext: r/ClaudeAI

Ad

👀 Siehe auch

Parallel-Sub-Agenten in Claude Code: Wann sie Tokens sparen vs. verbrennen
Werkzeuge

Parallel-Sub-Agenten in Claude Code: Wann sie Tokens sparen vs. verbrennen

Anthropic berichtet, dass Multi-Agent-Systeme etwa 15× mehr Tokens verbrauchen als ein einzelner Chat, aber Prompt-Caching bietet 90 % Rabatt auf Tokens. Ob Unter-Agenten Geld sparen oder verbrennen, hängt von den Cache-Trefferquoten ab.

OpenClawRadar
2026 Hermes-Agent-Alternativen-Rundumblick: Selbstgehostete Optionen von OpenClaw bis memU Bot
Werkzeuge

2026 Hermes-Agent-Alternativen-Rundumblick: Selbstgehostete Optionen von OpenClaw bis memU Bot

Ein Entwickler, der Hermes seit dem Start betreibt, hat nach dem ClawHub-Sicherheitsdebakel jede selbst gehostete und verwaltete Alternative getestet. Wichtige Ergebnisse: OpenClaw (370.000 Stars) aber 9 CVEs in 4 Tagen und ~20 % bösartige Pakete; TrustClaw mit OAuth/Sandboxing neu aufgebaut; nanobot mit ~4.000 Zeilen Python und MCP; memU Bot mit einzigartigem strukturiertem Gedächtnis. Verwaltete Optionen umfassen Perplexity Computer (19 Modelle, 200 $/Monat), Claude Cowork (öffnet echte Mac-Apps) und KimiClaw (40 GB RAG, an K2.5 gebunden, chinesisches Datenschutzrecht). Vollständige Übersicht unter der Quelle.

OpenClawRadar
CK Search: Lokales semantisches Suchtool mit MCP-Server-Integration
Werkzeuge

CK Search: Lokales semantisches Suchtool mit MCP-Server-Integration

CK Search ist ein lokales semantisches Suchwerkzeug mit einem integrierten MCP-Server, das beliebige Textverzeichnisse ohne Cloud-Abhängigkeiten indiziert. Das Tool kann von KI-Agenten über MCP genutzt werden, und die Quelle bietet eine praktische Schritt-für-Schritt-Anleitung, die Einrichtung, Stärken und Grenzen im Vergleich zu grep abdeckt.

OpenClawRadar
Lokale-Cloud-Hybride-KI-Architektur: Praktische Muster inspiriert von r/LocalLLaMA
Werkzeuge

Lokale-Cloud-Hybride-KI-Architektur: Praktische Muster inspiriert von r/LocalLLaMA

Der ursprüngliche Beitrag schlägt ein hybrides KI-Modell vor, bei dem ein lokales Modell Routineaufgaben übernimmt und komplexe Überlegungen über einen einzigen API-Aufruf an ein Cloud-Modell delegiert, zusammen mit einem deterministischen 'Hypervisor' für Sicherheitsvorkehrungen.

OpenClawRadar