Claude Code erstellt Pilot: Browser-Automatisierung per Nummern

Pilot ist ein Browser-Automatisierungstool, das vollständig von Claude Code erstellt und von einem Nicht-Entwickler angeleitet und getestet wurde. Es ermöglicht Claude, Chrome zu steuern, indem es den Barrierefreiheitsbaum liest – dieselbe Struktur, die Bildschirmlesegeräte verwenden – und klickbaren Elementen Nummern für eine präzise Navigation zuweist.

So funktioniert es

Das Tool wandelt Seitenelemente in kompakte Textdaten anstelle von Screenshots um. Jedes klickbare Element erhält eine Nummer, sodass Claude Befehle wie click 5 ausgeben kann, anstatt Bildschirmpositionen zu erraten. Dieser Ansatz bewältigt Popups und funktioniert über mehrere Tabs hinweg.

Einrichtung und Verwendung

Installieren Sie die Chrome-Erweiterung und starten Sie den Server
Tippen Sie /pilot in Claude Code ein
Bitten Sie Claude, Aufgaben wie "gehe zu YouTube und suche nach Koch-Tutorials" auszuführen

Mehrere Aktionen können in einem einzigen Aufruf gebündelt werden, und das Tool verarbeitet Seitendaten als kompakten Text anstelle von Screenshots.

Entwicklungserkenntnisse

Der Ersteller lernte beim Bauen mit KI mehrere wichtige Lektionen:

Klar zu beschreiben, was man will, ist der schwierigste Teil
Testen bleibt die Verantwortung des Menschen – Claude schreibt Code, aber Sie müssen überprüfen, ob er funktioniert
Die Entwicklung erforderte viele Iterationen, kein Ein-Schritt-Prozess

Das Tool ist kostenlos, MIT-lizenziert und funktioniert auf macOS, Linux und Windows. Das GitHub-Repository ist für diejenigen verfügbar, die an der Implementierung interessiert sind oder beitragen möchten.

📖 Read the full source: r/ClaudeAI

Pilot: Ein Browser-Automatisierungstool, vollständig mit Claude Code erstellt

So funktioniert es

Einrichtung und Verwendung

Entwicklungserkenntnisse

👀 Siehe auch

Claude Usage Monitor: Kostenlose macOS-Menüleisten-App zur Überwachung der Claude.ai-Limits

Wie ich in 2 Stunden mit Claude Code und Veo eine 3D-Scroll-Website erstellt habe

VTCode: Ein Rust TUI-Coding-Agent, der Kontext durch AST-Level-Chunking aggressiv kürzt

Parallele Coding-Agenten mit tmux und Markdown-Spezifikationen