TideSurf v0.3: Сжатие DOM в 30 раз для веб-агентов

Что делает TideSurf

TideSurf — это инструмент, решающий распространённую проблему с браузерными агентами: они часто полагаются на встроенную мультимодальность моделей вместо конкретных исходников страниц, и даже при использовании исходников потребляют чрезмерное количество токенов контекста. Решение преобразует отрендеренный DOM в сжатый формат, похожий на markdown, перед отправкой LLM-агентам.

Улучшение производительности

Согласно экспериментам со страницами GitHub, TideSurf сокращает потребление токенов в 32 раза по сравнению с исходным DOM. Процесс парсинга занимает примерно 30 мс. В конкретных тестах с Qwen 3.5 9B (reasoning off, Q8 KV Cache quant, остальные настройки по умолчанию) на MacBook Pro 14" Late 2021 (M1 Pro, 14C GPU, 16GB LPDDR5 Unified Memory, MacOS Tahoe 26.2) с использованием LM Studio 0.4.7-b2 и MLX runtime:

Токенов в секунду: 24.788 (исходный DOM) против 26.123 (TideSurf)
Время до первого токена: 106.641 с против 8.442 с (сокращение в 12.6 раз)
Время генерации: 9.117 с против 6.163 с
Токены промпта: 17 371 против 3 312 (включая определения инструментов)
Токены инференса: 226 против 161

Возможности инструментов

TideSurf включает 18 инструментов для LLM, чтобы работать с веб-страницами интерактивно. Эти инструменты работают с любой моделью, поддерживающей вызов инструментов. Система поддерживает как CLI, так и MCP (Model Context Protocol) интерфейсы.

Текущий статус и доступность

Это ранний проект версии 0.3, и разработчик ищет обратную связь. TideSurf доступен как npm-пакет (@tidesurf/core), с документацией на tidesurf.org/docs и исходным кодом на GitHub.

📖 Read the full source: r/LocalLLaMA

TideSurf: инструмент сжатия DOM сокращает использование токенов веб-агента в 30 раз, ускоряет TTFT в 12 раз

Что делает TideSurf

Улучшение производительности

Возможности инструментов

Текущий статус и доступность

👀 Смотрите также

Настройка Headless OpenClaw с Discord через Docker-скрипты

CloudRouter предоставляет возможности AI-кодирующим агентам с управлением ВМ и GPU.

js-notepad: Скриптуемый блокнот со встроенным MCP-сервером для кода Claude

Kreuzberg v4.7.0 добавляет интеллектуальный анализ кода для 248 языков и улучшенное извлечение разметки Markdown.