Browser-Harness: LLMs direkten CDP-Zugriff gewähren, um Browseraufgaben eigenständig zu korrigieren

✍️ OpenClawRadar📅 Veröffentlicht: 24. April 2026🔗 Source
Browser-Harness: LLMs direkten CDP-Zugriff gewähren, um Browseraufgaben eigenständig zu korrigieren
Ad

Browser Harness ist ein selbstheilendes Werkzeug, das LLMs vollständige Freiheit bei der Erledigung von Browseraufgaben gibt, indem es direkt über einen CDP-Websocket (~592 Zeilen Python) mit Chrome verbunden wird. Anstatt Chrome in vordefinierte Funktionen zu verpacken (wie Playwright MCP oder agent-browser), bietet es einen schlanken Daemon, der den Websocket, grundlegende Helfer und eine SKILL.md-Datei bereithält – und dem Agenten erlaubt, bei Bedarf eigene Tools zu schreiben.

So funktioniert es

Die Kernkonzepte sind:

  • Ein Daemon, der den CDP-Websocket am Leben hält
  • Sehr einfache Tools in helpers.py (~195 Zeilen)
  • Eine SKILL.md, die die Nutzung erklärt

Wenn das LLM eine Funktion benötigt, die nicht existiert, bearbeitet es helpers.py und fügt sie hinzu. Die Autoren berichten von einem Fall, in dem der Agent eine Datei hochladen wollte, keine upload_file()-Funktion fand, sie selbst mit DOM.setFileInputFiles schrieb und fortfuhr – nur in einem Git-Diff sichtbar.

Ad

Im Vergleich zu anderen Ansätzen

Andere Tools (Playwright MCP, browser-use CLI, agent-browser, Chrome DevTools MCP) hüllen Chrome in vordefinierte Funktionen. Ihr schlimmster Fehlermodus ist still: click() gibt Erfolg zurück, aber nichts ist passiert. Browser Harness zielt darauf ab, dem LLM perfekten Kontext und die Freiheit zur Selbstkorrektur zu geben.

Einrichtung und Installation

Installieren Sie es mit Claude Code oder Codex, indem Sie Folgendes einfügen:

Richten Sie https://github.com/browser-use/browser-harness für mich ein.

Der Agent liest install.md für den Start, dann SKILL.md für den normalen Gebrauch und prüft immer helpers.py auf verfügbare Funktionen.

Beispiele aus der Praxis

  • Spielt die Stockfish-Schachengine
  • Stellt einen Weltrekord in Tetris auf
  • Zeichnet ein Herz mit JavaScript

Mitwirken

Beiträge sind willkommen: Fügen Sie Domänenfähigkeiten unter domain-skills/ für Websites wie LinkedIn, Amazon usw. hinzu. Fähigkeiten werden vom Harness generiert, nicht von Hand erstellt. Fehlerbehebungen, Dokumentation und Verbesserungen der Helfer werden ebenfalls akzeptiert.

Lizenz: MIT.

📖 Vollständige Quelle lesen: HN LLM Tools

Ad

👀 Siehe auch

Indie-Entwickler setzt vollständige Game-Studio-Seite über Claude Code auf, inklusive Steam-API-Datenschicht
Werkzeuge

Indie-Entwickler setzt vollständige Game-Studio-Seite über Claude Code auf, inklusive Steam-API-Datenschicht

Ein Indie-Spieleentwickler nutzte Claude Code, um eine Studio-Website zu erstellen und bereitzustellen, ohne ein Terminal zu berühren, einschließlich einer Datenschicht, die Live-Informationen von der Steam-API abruft.

OpenClawRadar
bad-ass-mcp: Kostenloses, Open-Source-MCP für native Desktop-GUI-Steuerung über Accessibility-API
Werkzeuge

bad-ass-mcp: Kostenloses, Open-Source-MCP für native Desktop-GUI-Steuerung über Accessibility-API

bad-ass-mcp ist ein Open-Source-MCP-Server, der Claude und anderen KI-Agenten ermöglicht, macOS-, Windows- und Linux-Desktops über die native Barrierefreiheitsschicht zu steuern – ohne Screenshots, ohne Look-Move-Look-Schleifen. Kostenlose Alternative zu Computer Use, Operator oder UiPath.

OpenClawRadar
Logseq Brain v0.6.0: Persistent-Memory-Plugin für Claude Code fügt Journey Log und abschnittsbezogene Lesevorgänge hinzu
Werkzeuge

Logseq Brain v0.6.0: Persistent-Memory-Plugin für Claude Code fügt Journey Log und abschnittsbezogene Lesevorgänge hinzu

Logseq Brain v0.6.0 fügt ein Journey-Log für alle Operationen, abschnittsgezielte Lesevorgänge zur Einsparung von Tokens und progressive Offenlegung für Skill-Dateien hinzu.

OpenClawRadar
Omnicoder-9B-Leistungsbewertung: Geschwindigkeit vs. Probleme beim Tool-Aufruf
Werkzeuge

Omnicoder-9B-Leistungsbewertung: Geschwindigkeit vs. Probleme beim Tool-Aufruf

Omnicoder-9B, ein auf Codierung spezialisiertes Modell, das auf Qwen3.5 9B mit Ausgaben von Opus 4.6, GPT 5.4, GPT 5.3 Codex und Gemini 3.1 Pro feinabgestimmt wurde, zeigt starke Leistung auf mittlerer Hardware, hat jedoch Probleme mit Werkzeugaufrufen in IDEs.

OpenClawRadar