Pilot: Ein Browser-Automatisierungstool, vollständig mit Claude Code erstellt

Pilot ist ein Browser-Automatisierungstool, das vollständig von Claude Code erstellt und von einem Nicht-Entwickler angeleitet und getestet wurde. Es ermöglicht Claude, Chrome zu steuern, indem es den Barrierefreiheitsbaum liest – dieselbe Struktur, die Bildschirmlesegeräte verwenden – und klickbaren Elementen Nummern für eine präzise Navigation zuweist.
So funktioniert es
Das Tool wandelt Seitenelemente in kompakte Textdaten anstelle von Screenshots um. Jedes klickbare Element erhält eine Nummer, sodass Claude Befehle wie click 5 ausgeben kann, anstatt Bildschirmpositionen zu erraten. Dieser Ansatz bewältigt Popups und funktioniert über mehrere Tabs hinweg.
Einrichtung und Verwendung
- Installieren Sie die Chrome-Erweiterung und starten Sie den Server
- Tippen Sie
/pilotin Claude Code ein - Bitten Sie Claude, Aufgaben wie "gehe zu YouTube und suche nach Koch-Tutorials" auszuführen
Mehrere Aktionen können in einem einzigen Aufruf gebündelt werden, und das Tool verarbeitet Seitendaten als kompakten Text anstelle von Screenshots.
Entwicklungserkenntnisse
Der Ersteller lernte beim Bauen mit KI mehrere wichtige Lektionen:
- Klar zu beschreiben, was man will, ist der schwierigste Teil
- Testen bleibt die Verantwortung des Menschen – Claude schreibt Code, aber Sie müssen überprüfen, ob er funktioniert
- Die Entwicklung erforderte viele Iterationen, kein Ein-Schritt-Prozess
Das Tool ist kostenlos, MIT-lizenziert und funktioniert auf macOS, Linux und Windows. Das GitHub-Repository ist für diejenigen verfügbar, die an der Implementierung interessiert sind oder beitragen möchten.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

AgentPeek: Open-Source-Dashboard zur Überwachung von Claude-Code-Agent-Teams
AgentPeek ist ein lokales Dashboard, das sich in Claude Code einhakt, um Einblicke in Agententeams zu bieten, die Orchestrierungshierarchien, Ausführungsverläufe, Tokenkosten und Dateioperationen anzeigen. Die Installation erfordert das Klonen des GitHub-Repos und das Ausführen von pipx install.

Stage CLI: Lokale, KI-generierte Änderungen als logische Kapitel überprüft
Stage CLI gruppiert Ihre lokalen Änderungen in logische Kapitel (über jeden beliebigen KI-Agenten) und öffnet eine Browser-Oberfläche zur schrittweisen Überprüfung. Installieren Sie es mit 'npm install -g stagereview' und fügen Sie die Fähigkeit mit 'npx skills add ReviewStage/stage-cli' hinzu.

vllm-mlx-Fork fügt Tool-Calling und Prompt-Cache für lokale KI-Codierungsagenten hinzu
Ein Entwickler hat vllm-mlx modifiziert, um Probleme bei Tool-Aufrufen zu beheben und Prompt-Caching hinzuzufügen, wodurch die TTFT für OpenClaw auf Apple Silicon von 28s auf 0,3s reduziert wurde. Der Fork unterstützt Qwen3-Coder-Next mit 65 Tok/s auf dem M3 Ultra mit funktionierendem Funktionsaufruf.

ClawVibe: Ein freihändiger iOS-Sprachassistent für KI-Agenten mit geräteinternem STT/TTS
ClawVibe ist eine native iOS-App, die während der Fahrt freihändige Sprachinteraktion mit KI-Agenten ermöglicht. Sie nutzt geräteinterne Spracherkennung und TTS, unterstützt CarPlay und verwendet Sprachbiometrie, um Hintergrundgeräusche herauszufiltern. Über das Netzwerk werden nur Texte gesendet.