TideSurf: Ferramenta de compressão DOM reduz uso de tokens de agentes web em 30 vezes, acelera TTFT em 12 vezes

O que o TideSurf faz
O TideSurf é uma ferramenta que aborda um problema comum com agentes de uso do navegador: eles frequentemente dependem da multimodalidade nativa dos modelos em vez de fontes de página concretas, e mesmo quando usam fontes de página, consomem tokens de contexto em excesso. A solução converte o DOM renderizado para um formato compactado semelhante a markdown antes de enviá-lo para agentes de LLM.
Melhorias de desempenho
De acordo com experimentos com páginas do GitHub, o TideSurf reduz o consumo de tokens em 32 vezes em comparação com o DOM bruto. O processo de análise leva aproximadamente 30ms. Em testes específicos com Qwen 3.5 9B (raciocínio desativado, cache KV Q8 quantizado, outras configurações padrão) em um MacBook Pro 14" Final de 2021 (M1 Pro, GPU 14C, 16GB LPDDR5 Unified Memory, MacOS Tahoe 26.2) usando LM Studio 0.4.7-b2 com runtime MLX:
- Tokens por segundo: 24.788 (DOM bruto) vs 26.123 (TideSurf)
- Tempo até o primeiro token: 106.641s vs 8.442s (redução de 12.6x)
- Tempo de geração: 9.117s vs 6.163s
- Tokens do prompt: 17.371 vs 3.312 (incluindo definições de ferramentas)
- Tokens de inferência: 226 vs 161
Capacidades das ferramentas
O TideSurf inclui 18 ferramentas para LLMs trabalharem interativamente com páginas da web. Essas ferramentas funcionam com qualquer modelo que tenha capacidades de chamada de ferramentas. O sistema suporta interfaces CLI e MCP (Model Context Protocol).
Status atual e disponibilidade
Este é um projeto inicial na versão 0.3, e o desenvolvedor está buscando feedback. O TideSurf está disponível como um pacote npm (@tidesurf/core), com documentação em tidesurf.org/docs e código-fonte no GitHub.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Estrutura de Autorrefinamento Recursivo para Agentes de Codificação de IA Usando Claude Code
Um framework de código aberto permite que agentes de codificação de IA melhorem-se recursivamente usando Claude Code. O sistema analisa rastros dos agentes, identifica padrões de falha e implementa correções, alcançando um aumento de 25% no desempenho em um ciclo de teste.

Construindo uma Infraestrutura de Conhecimento de IA Persistente com OpenClaw
Um desenvolvedor criou o 'Brain' — um serviço central de conhecimento com RAG local, coordenação multiagente e um sistema de plugins tipados — para resolver o problema de ausência de estado em configurações de IA. O sistema roda inteiramente em hardware local usando Ollama, Postgres, MongoDB, Qdrant e Memgraph.

AGI em md: 11 Níveis de Compressão Cognitiva para Prompts do Sistema Claude
Um repositório do GitHub documenta 11 níveis de compressão cognitiva que podem ser codificados em prompts de sistema do Claude, com o Nível 8 mudando da análise para a construção e melhorando o desempenho do Haiku de 0/3 para 4/4. O projeto inclui 28 prompts, 299 saídas brutas e logs completos de experimentos em 19 domínios.

Sistema Multi-Agente para Análise Competitiva Aprofundada com Claude
Um desenvolvedor criou um sistema de agentes em três ondas que vai além de listas superficiais de concorrentes para extrair inteligência de preços, padrões de sentimento do cliente e sinais estratégicos por meio de pesquisa estruturada de múltiplas fontes.