Arnês do Navegador: Concedendo aos LLMs acesso bruto ao CDP para autocorrigir tarefas no navegador

✍️ OpenClawRadar📅 Publicado: April 24, 2026🔗 Source
Arnês do Navegador: Concedendo aos LLMs acesso bruto ao CDP para autocorrigir tarefas no navegador
Ad

Browser Harness é um harness auto-recuperável que dá às LLMs liberdade total para concluir tarefas no navegador ao se conectar diretamente ao Chrome via um websocket CDP (~592 linhas de Python). Em vez de envolver o Chrome em funções predefinidas (como Playwright MCP ou agent-browser), ele fornece um daemon leve que mantém o websocket, ajudantes básicos e um arquivo SKILL.md — e deixa o agente escrever suas próprias ferramentas quando necessário.

Como funciona

Os conceitos principais são:

  • Um daemon que mantém o websocket CDP ativo
  • Ferramentas extremamente básicas em helpers.py (~195 linhas)
  • Um SKILL.md que explica o uso

Quando a LLM precisa de uma função que não existe, ela edita helpers.py e a adiciona. Os autores relatam um caso em que o agente queria fazer upload de um arquivo, não encontrou uma função upload_file(), escreveu ela mesma usando DOM.setFileInputFiles e continuou — visível apenas em um git diff.

Ad

vs. outras abordagens

Outras ferramentas (Playwright MCP, browser-use CLI, agent-browser, Chrome DevTools MCP) envolvem o Chrome em funções predefinidas. Seu pior modo de falha é silencioso: click() retorna sucesso, mas nada aconteceu. Browser Harness visa dar à LLM contexto perfeito e liberdade para autocorreção.

Configuração e instalação

Instale com Claude Code ou Codex colando:

Set up https://github.com/browser-use/browser-harness for me.

O agente lê install.md para inicialização, depois SKILL.md para uso normal e sempre verifica helpers.py para funções disponíveis.

Exemplos reais

  • Joga o motor de xadrez Stockfish
  • Define um recorde mundial no Tetris
  • Desenha um coração com JavaScript

Contribuindo

Contribuições bem-vindas: adicione habilidades de domínio em domain-skills/ para sites como LinkedIn, Amazon, etc. As habilidades são geradas pelo harness, não escritas à mão. Correções de bugs, documentação e melhorias nos helpers também são aceitas.

Licença: MIT.

📖 Leia a fonte completa: HN LLM Tools

Ad

👀 See Also

Linha de status personalizada para Claude Code mostra uso de contexto, limites de taxa e contagens de tokens de relance
Tools

Linha de status personalizada para Claude Code mostra uso de contexto, limites de taxa e contagens de tokens de relance

Um script personalizado adiciona uma linha de status persistente ao Claude Code, exibindo % de contexto, % de limite de taxa de 5 horas, leituras de cache KV, tokens de entrada/saída cumulativos, nome do modelo e diretório de trabalho — com código de cores para terminais escuros.

OpenClawRadar
OpenClawDreams: Uma Extensão de Simulador de Sonhos para Agentes OpenClaw
Tools

OpenClawDreams: Uma Extensão de Simulador de Sonhos para Agentes OpenClaw

OpenClawDreams é uma extensão que adiciona um processo de reflexão em segundo plano e um ciclo de sonhos noturno aos agentes OpenClaw. Ele captura resumos criptografados das conversas em um banco de dados SQLite local, processa-os durante ciclos em segundo plano e gera insights consolidados que são enviados para a memória persistente do agente.

OpenClawRadar
ProofShot: CLI para Agentes de IA Verificarem Código de UI com Gravação de Navegador
Tools

ProofShot: CLI para Agentes de IA Verificarem Código de UI com Gravação de Navegador

ProofShot é uma ferramenta CLI que permite que agentes de IA de programação abram um navegador, interajam com páginas, gravem sessões e coletem erros, depois empacotam tudo em um arquivo HTML autônomo para revisão. Funciona com qualquer agente de IA via comandos de shell e é empacotado como uma habilidade.

OpenClawRadar
OpenAlly: Assistente de IA Local para Android com Controle Telefônico
Tools

OpenAlly: Assistente de IA Local para Android com Controle Telefônico

OpenAlly é um aplicativo Android que executa um assistente de IA localmente no seu telefone por meio de um processo Node.js embutido, com 51 habilidades integradas e capacidades de controle do telefone através do Aster companion. Ele se conecta a mais de 19 plataformas de mensagens e suporta 18 provedores de modelos com suas próprias chaves de API.

OpenClawRadar