Arnês do Navegador: Concedendo aos LLMs acesso bruto ao CDP para autocorrigir tarefas no navegador

Browser Harness é um harness auto-recuperável que dá às LLMs liberdade total para concluir tarefas no navegador ao se conectar diretamente ao Chrome via um websocket CDP (~592 linhas de Python). Em vez de envolver o Chrome em funções predefinidas (como Playwright MCP ou agent-browser), ele fornece um daemon leve que mantém o websocket, ajudantes básicos e um arquivo SKILL.md — e deixa o agente escrever suas próprias ferramentas quando necessário.
Como funciona
Os conceitos principais são:
- Um daemon que mantém o websocket CDP ativo
- Ferramentas extremamente básicas em
helpers.py(~195 linhas) - Um
SKILL.mdque explica o uso
Quando a LLM precisa de uma função que não existe, ela edita helpers.py e a adiciona. Os autores relatam um caso em que o agente queria fazer upload de um arquivo, não encontrou uma função upload_file(), escreveu ela mesma usando DOM.setFileInputFiles e continuou — visível apenas em um git diff.
vs. outras abordagens
Outras ferramentas (Playwright MCP, browser-use CLI, agent-browser, Chrome DevTools MCP) envolvem o Chrome em funções predefinidas. Seu pior modo de falha é silencioso: click() retorna sucesso, mas nada aconteceu. Browser Harness visa dar à LLM contexto perfeito e liberdade para autocorreção.
Configuração e instalação
Instale com Claude Code ou Codex colando:
Set up https://github.com/browser-use/browser-harness for me.
O agente lê install.md para inicialização, depois SKILL.md para uso normal e sempre verifica helpers.py para funções disponíveis.
Exemplos reais
- Joga o motor de xadrez Stockfish
- Define um recorde mundial no Tetris
- Desenha um coração com JavaScript
Contribuindo
Contribuições bem-vindas: adicione habilidades de domínio em domain-skills/ para sites como LinkedIn, Amazon, etc. As habilidades são geradas pelo harness, não escritas à mão. Correções de bugs, documentação e melhorias nos helpers também são aceitas.
Licença: MIT.
📖 Leia a fonte completa: HN LLM Tools
👀 See Also

Linha de status personalizada para Claude Code mostra uso de contexto, limites de taxa e contagens de tokens de relance
Um script personalizado adiciona uma linha de status persistente ao Claude Code, exibindo % de contexto, % de limite de taxa de 5 horas, leituras de cache KV, tokens de entrada/saída cumulativos, nome do modelo e diretório de trabalho — com código de cores para terminais escuros.

OpenClawDreams: Uma Extensão de Simulador de Sonhos para Agentes OpenClaw
OpenClawDreams é uma extensão que adiciona um processo de reflexão em segundo plano e um ciclo de sonhos noturno aos agentes OpenClaw. Ele captura resumos criptografados das conversas em um banco de dados SQLite local, processa-os durante ciclos em segundo plano e gera insights consolidados que são enviados para a memória persistente do agente.

ProofShot: CLI para Agentes de IA Verificarem Código de UI com Gravação de Navegador
ProofShot é uma ferramenta CLI que permite que agentes de IA de programação abram um navegador, interajam com páginas, gravem sessões e coletem erros, depois empacotam tudo em um arquivo HTML autônomo para revisão. Funciona com qualquer agente de IA via comandos de shell e é empacotado como uma habilidade.

OpenAlly: Assistente de IA Local para Android com Controle Telefônico
OpenAlly é um aplicativo Android que executa um assistente de IA localmente no seu telefone por meio de um processo Node.js embutido, com 51 habilidades integradas e capacidades de controle do telefone através do Aster companion. Ele se conecta a mais de 19 plataformas de mensagens e suporta 18 provedores de modelos com suas próprias chaves de API.