Arnês do Navegador: LLM com Acesso CDP Bruto

Browser Harness é um harness auto-recuperável que dá às LLMs liberdade total para concluir tarefas no navegador ao se conectar diretamente ao Chrome via um websocket CDP (~592 linhas de Python). Em vez de envolver o Chrome em funções predefinidas (como Playwright MCP ou agent-browser), ele fornece um daemon leve que mantém o websocket, ajudantes básicos e um arquivo SKILL.md — e deixa o agente escrever suas próprias ferramentas quando necessário.

Como funciona

Os conceitos principais são:

Um daemon que mantém o websocket CDP ativo
Ferramentas extremamente básicas em helpers.py (~195 linhas)
Um SKILL.md que explica o uso

Quando a LLM precisa de uma função que não existe, ela edita helpers.py e a adiciona. Os autores relatam um caso em que o agente queria fazer upload de um arquivo, não encontrou uma função upload_file(), escreveu ela mesma usando DOM.setFileInputFiles e continuou — visível apenas em um git diff.

vs. outras abordagens

Outras ferramentas (Playwright MCP, browser-use CLI, agent-browser, Chrome DevTools MCP) envolvem o Chrome em funções predefinidas. Seu pior modo de falha é silencioso: click() retorna sucesso, mas nada aconteceu. Browser Harness visa dar à LLM contexto perfeito e liberdade para autocorreção.

Configuração e instalação

Instale com Claude Code ou Codex colando:

Set up https://github.com/browser-use/browser-harness for me.

O agente lê install.md para inicialização, depois SKILL.md para uso normal e sempre verifica helpers.py para funções disponíveis.

Exemplos reais

Joga o motor de xadrez Stockfish
Define um recorde mundial no Tetris
Desenha um coração com JavaScript

Contribuindo

Contribuições bem-vindas: adicione habilidades de domínio em domain-skills/ para sites como LinkedIn, Amazon, etc. As habilidades são geradas pelo harness, não escritas à mão. Correções de bugs, documentação e melhorias nos helpers também são aceitas.

Licença: MIT.

📖 Leia a fonte completa: HN LLM Tools

Arnês do Navegador: Concedendo aos LLMs acesso bruto ao CDP para autocorrigir tarefas no navegador

Como funciona

vs. outras abordagens

Configuração e instalação

Exemplos reais

Contribuindo

👀 See Also

Automatize a revisão de PRs do GitHub com agentes Claude Code

Localizador de Circuitos LLM: Duplique 3 camadas para aumentar o raciocínio sem treinamento

Contador de Startups: Habilidade Gratuita do Claude para Acompanhamento de Pequenos Negócios

Netflix Lança VOID: Modelo de Exclusão de Objetos e Interações em Vídeo no Hugging Face