Browser-Harness: LLMs mit direktem CDP-Zugriff

Browser Harness ist ein selbstheilendes Werkzeug, das LLMs vollständige Freiheit bei der Erledigung von Browseraufgaben gibt, indem es direkt über einen CDP-Websocket (~592 Zeilen Python) mit Chrome verbunden wird. Anstatt Chrome in vordefinierte Funktionen zu verpacken (wie Playwright MCP oder agent-browser), bietet es einen schlanken Daemon, der den Websocket, grundlegende Helfer und eine SKILL.md-Datei bereithält – und dem Agenten erlaubt, bei Bedarf eigene Tools zu schreiben.

So funktioniert es

Die Kernkonzepte sind:

Ein Daemon, der den CDP-Websocket am Leben hält
Sehr einfache Tools in helpers.py (~195 Zeilen)
Eine SKILL.md, die die Nutzung erklärt

Wenn das LLM eine Funktion benötigt, die nicht existiert, bearbeitet es helpers.py und fügt sie hinzu. Die Autoren berichten von einem Fall, in dem der Agent eine Datei hochladen wollte, keine upload_file()-Funktion fand, sie selbst mit DOM.setFileInputFiles schrieb und fortfuhr – nur in einem Git-Diff sichtbar.

Im Vergleich zu anderen Ansätzen

Andere Tools (Playwright MCP, browser-use CLI, agent-browser, Chrome DevTools MCP) hüllen Chrome in vordefinierte Funktionen. Ihr schlimmster Fehlermodus ist still: click() gibt Erfolg zurück, aber nichts ist passiert. Browser Harness zielt darauf ab, dem LLM perfekten Kontext und die Freiheit zur Selbstkorrektur zu geben.

Einrichtung und Installation

Installieren Sie es mit Claude Code oder Codex, indem Sie Folgendes einfügen:

Richten Sie https://github.com/browser-use/browser-harness für mich ein.

Der Agent liest install.md für den Start, dann SKILL.md für den normalen Gebrauch und prüft immer helpers.py auf verfügbare Funktionen.

Beispiele aus der Praxis

Spielt die Stockfish-Schachengine
Stellt einen Weltrekord in Tetris auf
Zeichnet ein Herz mit JavaScript

Mitwirken

Beiträge sind willkommen: Fügen Sie Domänenfähigkeiten unter domain-skills/ für Websites wie LinkedIn, Amazon usw. hinzu. Fähigkeiten werden vom Harness generiert, nicht von Hand erstellt. Fehlerbehebungen, Dokumentation und Verbesserungen der Helfer werden ebenfalls akzeptiert.

Lizenz: MIT.

📖 Vollständige Quelle lesen: HN LLM Tools