Opendesk: MCP + SOM-Algorithmus zur KI-Desktopsteuerung über Claude Code

Opendesk ist ein Open-Source-MCP-Server, der KI-Agenten die vollständige Kontrolle über Ihren Desktop ermöglicht – einschließlich Maus und Tastatur – und dabei einen benutzerdefinierten Self-Organizing Map (SOM)-Algorithmus für verbesserte Genauigkeit verwendet. Es integriert sich mit Claude Code oder jeder benutzerdefinierten Agentenplattform und ermöglicht echte Desktop-Automatisierungsworkflows.
Hauptfunktionen
- Desktop-Steuerung: Agenten können die Maus bewegen, klicken und tippen, um mit jeder Anwendung oder Website zu interagieren.
- Lernen & Wiederholen: Zeichnen Sie eine Abfolge von Aktionen auf (z. B. Anmelden in einem Dashboard und Exportieren eines Berichts) und spielen Sie sie später auf Befehl ab.
- Planung: Führen Sie Computeraufgaben automatisch zu bestimmten Zeiten aus – z. B. jeden Morgen um 9 Uhr Gmail öffnen und ungelesene E-Mails zusammenfassen.
Beispielbefehle
- „Öffne Spotify und spiele eine Lofi-Playlist ab“
- „Gehe zu Twitter und like die ersten 3 Beiträge in meinem Feed“
- „Fülle dieses Formular in Chrome aus“
Integration
Funktioniert mit Claude Code und jeder benutzerdefinierten Agentenplattform, die MCP unterstützt. Der SOM-Algorithmus verbessert die Klick-/Zielgenauigkeit im Vergleich zu herkömmlichen Computer-Use-Implementierungen.
Erste Schritte
Quellcode und Dokumentation verfügbar auf GitHub: github.com/vitalops/opendesk
📖 Lesen Sie die vollständige Quelle: r/ClaudeAI
👀 Siehe auch

OpenClaw-Erweiterung leitet Anfragen über Claude Code CLI statt über die API weiter
Eine OpenClaw-Erweiterung startet die Claude CLI-Binärdatei als Unterprozess und leitet Anfragen über die Claude Code CLI statt über die Anthropic API. Dies bietet das vollständige Claude Code-Erlebnis zum Pauschalpreis eines Max-Plans.

Entwickler baut GALA-Programmiersprache mit Claude Code, stellt fest: Starke Typisierung verbessert Zuverlässigkeit KI-generierter Codes
Ein Entwickler hat GALA erstellt, eine funktionale Programmiersprache, die zu Go transpiliert, wobei er intensiv Claude Code genutzt hat. Die Sprache bietet versiegelte Typen, erschöpfendes Pattern Matching, standardmäßige Unveränderlichkeit und Monaden, wobei Claude bei der Implementierung von Typinferenz, Pattern-Matching-Transformatoren und der Behebung von über 40 Fehlern geholfen hat.

Claudes stiller Absturz: Der Ausfall der Handlungsebene, wenn KI-Agenten auf Geschäftsseiten treffen
Claude kann Geschäftsseiten (Preise, Buchungsabläufe, Formulare) lesen, scheitert jedoch an der Handlungsebene – Buchung, Übermittlung oder Weiterleitung – aufgrund fehlender aufrufbarer Endpunkte. Dies verursacht unsichtbare Nutzerabbrüche ohne Analysesignal.

skillcheck: Ein Linter für SKILL.md-Dateien, der plattformübergreifende Kompatibilitätsprobleme erkennt
skillcheck ist ein Python-Tool, das SKILL.md-Dateien gemäß der agentskills.io-Spezifikation validiert und bietet einzigartige Funktionen wie Bewertung der Beschreibungsqualität, Warnungen zu Claude-spezifischen Feldern und Überprüfung von Dateiverweisen, die in bestehenden Validatoren nicht verfügbar sind.