OpenYak: Open-Source Desktop-KI-Agent für lokale Dateiverwaltung und Automatisierung

Was OpenYak leistet
OpenYak ist ein Open-Source-Desktop-KI-Assistent, der vollständig auf Ihrem Rechner läuft. Er verwaltet Dateien, analysiert Daten, verfasst Dokumententwürfe und automatisiert Büroabläufe, ohne etwas in die Cloud hochzuladen.
Wichtige Funktionen und Fähigkeiten
- Büroautomatisierung – Dateien stapelweise umbenennen, sortieren und in Ordnern bereinigen mit nachvollziehbaren Änderungsprotokollen
- Datenanalyse – Tabellenkalkulationen, CSVs und Dokumente lokal analysieren, um Anomalien zu erkennen, Trends zu verfolgen und entscheidungsfertige Berichte zu exportieren
- Inhalte & Texterstellung – Rohentwürfe in ausgefeilte Dokumente verwandeln und professionelle Kommunikation verfassen
- Teamoperationen – Notizen aus PDFs, DOCX und CSVs zu strukturierten Briefings zusammenführen mit automatisch extrahierten Aufgaben und Fristenverfolgung
- IM-Integration – 8+ Messaging-Plattformen (WhatsApp, Discord, Telegram, Slack, Feishu, Signal, iMessage) über OpenClaw verbinden für zentralisiertes Nachrichtenmanagement
- Automatisierungen – Wiederkehrende Aufgaben mit Cron-Triggers planen für tägliche Datenzusammenfassungen, wöchentliche Berichte und automatische Dateibereinigung
- Remote-Workflows – Auf dem Desktop beginnen und auf dem Smartphone fortsetzen mit One-Click-Secure-Tunnel und QR-Code-Zugang
Technische Spezifikationen
- 100 % Lokal-First – Keine Cloud-Speicherung oder Telemetrie; alle Daten bleiben auf Ihrem Rechner
- 100+ KI-Modelle – Zugriff über OpenRouter inklusive Claude Opus 4.6 & Sonnet 4.6, DeepSeek V3.2, Gemini 3 Flash, GPT-4.1, MiniMax M2.5, Step 3.5 Flash, MiMo-V2-Pro
- 20+ BYOK-Anbieter – Bringen Sie Ihren eigenen API-Schlüssel mit für OpenAI, Anthropic, Google, Groq, DeepSeek, Mistral, xAI, plus chinesische Anbieter wie Qwen, Kimi, MiniMax und ZhiPu
- ChatGPT-Abonnement-Integration – Bestehendes ChatGPT-Abonnement direkt verbinden ohne zusätzliche API-Kosten
- 20+ integrierte Tools – Dateien lesen/schreiben/bearbeiten, Bash-Ausführung, Glob/Grep-Suche, Web-Abruf, Langzeitgedächtnis
- 7 Agenten-Modi – Spezialisierte Agenten für Entwicklung, Planung, Erkundung mit mehrstufigem Tool-Calling und Sub-Agenten-Verschachtelung
- Langzeitgedächtnis – Speichert Präferenzen, Arbeitskontext und wichtige Fakten über Konversationen hinweg lokal
- MCP-Connectors – Externe Tools und Dienste über Model Context Protocol integrieren
- Preise – 1M Tokens/Woche bei kostenlosen Modellen, Pay-as-you-go zu OpenRouter-Preisen ohne Aufschlag, oder eigenen API-Schlüssel mitbringen
Erste Schritte
- Installer für Windows oder macOS herunterladen
- Modell verbinden – kostenlose Modelle sofort nutzen, für Premium-Modelle aufladen, eigenen API-Schlüssel von 20+ Anbietern mitbringen oder lokal über Ollama ausführen
- Mit der Arbeit beginnen – Dateien verwalten, lokale Daten analysieren und bürofertige Ausgaben generieren
Für Entwickler sind technische Details, Projektstruktur und Entwicklungseinrichtung in frontend/README.md und backend/README.md verfügbar. Das Projekt ist unter AGPL-3.0 lizenziert und wurde mit Python (60,2 %), TypeScript (31,7 %), HTML (5,4 %), Rust (1,5 %), CSS (0,5 %) und Shell (0,4 %) erstellt.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Menschlicher-Pipeline Open-Source: Sechs-Schritte-Markdown-Datei für die Nachbearbeitung von KI-Texten
Eine einzelne Markdown-Datei implementiert eine sechsstufige Pipeline zur Erkennung und Umschreibung KI-generierter Texte mit Kanalerkennung, Stimmkalibrierung, Schweregradstufen und Selbstprüfung.

Browser-Harness: LLMs direkten CDP-Zugriff gewähren, um Browseraufgaben eigenständig zu korrigieren
Browser Harness entfernt Browser-Frameworks und gewährt LLMs direkten CDP-Websocket-Zugriff, sodass sie fehlende Tools während der Aufgabe selbst schreiben können. Demonstriert durch die selbstständige Erstellung einer upload_file()-Funktion.

Agent Architect: Kostenloses Tool generiert vollständige Arbeitsbereichsdateien für KI-Agenten
Agent Architect ist ein kostenloses interaktives Tool, das Nutzer durch 40+ Fragen zu ihrem KI-Agenten führt und alles zu einem formatierten Prompt zusammenstellt, um sieben produktionsreife Workspace-Dateien zu generieren: SOUL.md, IDENTITY.md, AGENTS.md, OPERATIONS.md, TOOLS.md, MEMORY.md und HEARTBEAT.md.

LAP: Über 1.500 API-Spezifikationen für die Nutzung durch LLMs zusammengestellt, um Halluzinationen bei Claude zu reduzieren
LAP ist ein Tool, das über 1.500 echte API-Spezifikationen in ein schlankes Format kompiliert, das für LLMs optimiert ist. Es bietet verifizierte Endpunkte und Parameter, um KI-Coding-Agenten wie Claude davon abzuhalten, falsche API-Aufrufe zu halluzinieren.