WebClaw: Servidor MCP de Código Aberto para Extração Web com Claude

WebClaw é um servidor MCP construído em Rust que adiciona capacidades de extração web ao Claude Desktop e Claude Code. Ele resolve o problema em que o web_fetch integrado do Claude é bloqueado na maioria dos sites reais, retornando erros 403 Forbidden, desafios do Cloudflare ou respostas vazias.
Solução Técnica
O servidor usa impressão digital TLS na camada HTTP para que os sites vejam uma impressão digital real do navegador Chrome em vez de um bot. Em testes com 10 sites populares, o web_fetch integrado do Claude falhou em todos os 10, enquanto o WebClaw extraiu conteúdo com sucesso de 9 dos 10 sites.
Recursos
scrape: Extrai conteúdo limpo de qualquer URLcrawl: Rastreamento recursivo de sitesextract: Extração de dados estruturados usando esquema JSON ou prompts em linguagem naturalsummarize: Resumos de páginasbrand: Extrai cores, fontes, logotipos de qualquer sitediff: Acompanha alterações de conteúdo- Ferramentas
map,batch,search,research
Desenvolvimento com Claude Code
O pipeline de extração foi implementado com Claude Code, incluindo:
- Algoritmo de pontuação baseado em densidade de texto, tags semânticas e penalidades de proporção de links
- Filtro de ruído que remove navegação, anúncios e banners de cookies sem falsos positivos em classes Tailwind
- Múltiplas rodadas de refinamento para casos extremos
Configuração e Uso
A configuração requer apenas um comando:
npx create-webclaw
A ferramenta detecta automaticamente o Claude Desktop e Claude Code e escreve a configuração. Nenhuma chave de API é necessária para 8 das 10 ferramentas, e tudo é executado localmente.
Benefícios de Desempenho
A saída é otimizada para a janela de contexto do Claude. Um artigo de notícia típico vai de 4.820 tokens (HTML bruto) para 1.590 tokens no formato LLM do WebClaw - uma redução de 67% mantendo o mesmo conteúdo.
WebClaw é gratuito e de código aberto sob a licença MIT, disponível em https://github.com/0xMassi/webclaw.
📖 Read the full source: r/ClaudeAI
👀 See Also

Mãos na obra com o modelo da Tencent: Forte para fluxos de trabalho agentivos, fraco para codificação complexa
O modelo da Tencent obtém nota 8/10 para tarefas agentivas com baixas taxas de alucinação, mas falha em codificação complexa como esquemas da API do Notion. Evite para lógica de backend.
Claude Code vs Codex: 36 vs 28 arquivos, $2,50 vs $2,04, loop infinito detectado — comparação no mundo real
Um desenvolvedor executa as mesmas duas tarefas no Claude Code e no Codex (Cursor): bot de triagem de PR e interface de revisão de código em tempo real. Resultados: 36 vs 28 arquivos, custo de $2,50 vs $2,04, Claude produziu menos erros TypeScript, Codex teve um loop infinito no React.

A ferramenta de correção de memória do OpenClaw resolve a degradação de desempenho.
Um novo comando de barra chamado /claw_memory_fix ajuda a limpar arquivos de memória do OpenClaw quando o agente esquece credenciais ou permissões. A ferramenta implementa técnicas da Alibaba, engenharia do GitHub, MemGPT e pesquisas de janeiro de 2026 sobre gerenciamento de memória.

Zikra: Servidor de Memória MCP Auto-hospedado para Claude Code, Cursor e Codex
Zikra é um servidor de memória MCP auto-hospedado que salva automaticamente cada decisão, erro e requisito quando as sessões do Claude Code terminam através de um hook Stop, criando um pool de memória compartilhada acessível entre ferramentas e membros da equipe.