Browser-Harness: LLMs direkten CDP-Zugriff gewähren, um Browseraufgaben eigenständig zu korrigieren

Browser Harness ist ein selbstheilendes Werkzeug, das LLMs vollständige Freiheit bei der Erledigung von Browseraufgaben gibt, indem es direkt über einen CDP-Websocket (~592 Zeilen Python) mit Chrome verbunden wird. Anstatt Chrome in vordefinierte Funktionen zu verpacken (wie Playwright MCP oder agent-browser), bietet es einen schlanken Daemon, der den Websocket, grundlegende Helfer und eine SKILL.md-Datei bereithält – und dem Agenten erlaubt, bei Bedarf eigene Tools zu schreiben.
So funktioniert es
Die Kernkonzepte sind:
- Ein Daemon, der den CDP-Websocket am Leben hält
- Sehr einfache Tools in
helpers.py(~195 Zeilen) - Eine
SKILL.md, die die Nutzung erklärt
Wenn das LLM eine Funktion benötigt, die nicht existiert, bearbeitet es helpers.py und fügt sie hinzu. Die Autoren berichten von einem Fall, in dem der Agent eine Datei hochladen wollte, keine upload_file()-Funktion fand, sie selbst mit DOM.setFileInputFiles schrieb und fortfuhr – nur in einem Git-Diff sichtbar.
Im Vergleich zu anderen Ansätzen
Andere Tools (Playwright MCP, browser-use CLI, agent-browser, Chrome DevTools MCP) hüllen Chrome in vordefinierte Funktionen. Ihr schlimmster Fehlermodus ist still: click() gibt Erfolg zurück, aber nichts ist passiert. Browser Harness zielt darauf ab, dem LLM perfekten Kontext und die Freiheit zur Selbstkorrektur zu geben.
Einrichtung und Installation
Installieren Sie es mit Claude Code oder Codex, indem Sie Folgendes einfügen:
Richten Sie https://github.com/browser-use/browser-harness für mich ein.
Der Agent liest install.md für den Start, dann SKILL.md für den normalen Gebrauch und prüft immer helpers.py auf verfügbare Funktionen.
Beispiele aus der Praxis
- Spielt die Stockfish-Schachengine
- Stellt einen Weltrekord in Tetris auf
- Zeichnet ein Herz mit JavaScript
Mitwirken
Beiträge sind willkommen: Fügen Sie Domänenfähigkeiten unter domain-skills/ für Websites wie LinkedIn, Amazon usw. hinzu. Fähigkeiten werden vom Harness generiert, nicht von Hand erstellt. Fehlerbehebungen, Dokumentation und Verbesserungen der Helfer werden ebenfalls akzeptiert.
Lizenz: MIT.
📖 Vollständige Quelle lesen: HN LLM Tools
👀 Siehe auch

Indie-Entwickler setzt vollständige Game-Studio-Seite über Claude Code auf, inklusive Steam-API-Datenschicht
Ein Indie-Spieleentwickler nutzte Claude Code, um eine Studio-Website zu erstellen und bereitzustellen, ohne ein Terminal zu berühren, einschließlich einer Datenschicht, die Live-Informationen von der Steam-API abruft.

bad-ass-mcp: Kostenloses, Open-Source-MCP für native Desktop-GUI-Steuerung über Accessibility-API
bad-ass-mcp ist ein Open-Source-MCP-Server, der Claude und anderen KI-Agenten ermöglicht, macOS-, Windows- und Linux-Desktops über die native Barrierefreiheitsschicht zu steuern – ohne Screenshots, ohne Look-Move-Look-Schleifen. Kostenlose Alternative zu Computer Use, Operator oder UiPath.

Logseq Brain v0.6.0: Persistent-Memory-Plugin für Claude Code fügt Journey Log und abschnittsbezogene Lesevorgänge hinzu
Logseq Brain v0.6.0 fügt ein Journey-Log für alle Operationen, abschnittsgezielte Lesevorgänge zur Einsparung von Tokens und progressive Offenlegung für Skill-Dateien hinzu.

Omnicoder-9B-Leistungsbewertung: Geschwindigkeit vs. Probleme beim Tool-Aufruf
Omnicoder-9B, ein auf Codierung spezialisiertes Modell, das auf Qwen3.5 9B mit Ausgaben von Opus 4.6, GPT 5.4, GPT 5.3 Codex und Gemini 3.1 Pro feinabgestimmt wurde, zeigt starke Leistung auf mittlerer Hardware, hat jedoch Probleme mit Werkzeugaufrufen in IDEs.