TideSurf: инструмент сжатия DOM сокращает использование токенов веб-агента в 30 раз, ускоряет TTFT в 12 раз

Что делает TideSurf
TideSurf — это инструмент, решающий распространённую проблему с браузерными агентами: они часто полагаются на встроенную мультимодальность моделей вместо конкретных исходников страниц, и даже при использовании исходников потребляют чрезмерное количество токенов контекста. Решение преобразует отрендеренный DOM в сжатый формат, похожий на markdown, перед отправкой LLM-агентам.
Улучшение производительности
Согласно экспериментам со страницами GitHub, TideSurf сокращает потребление токенов в 32 раза по сравнению с исходным DOM. Процесс парсинга занимает примерно 30 мс. В конкретных тестах с Qwen 3.5 9B (reasoning off, Q8 KV Cache quant, остальные настройки по умолчанию) на MacBook Pro 14" Late 2021 (M1 Pro, 14C GPU, 16GB LPDDR5 Unified Memory, MacOS Tahoe 26.2) с использованием LM Studio 0.4.7-b2 и MLX runtime:
- Токенов в секунду: 24.788 (исходный DOM) против 26.123 (TideSurf)
- Время до первого токена: 106.641 с против 8.442 с (сокращение в 12.6 раз)
- Время генерации: 9.117 с против 6.163 с
- Токены промпта: 17 371 против 3 312 (включая определения инструментов)
- Токены инференса: 226 против 161
Возможности инструментов
TideSurf включает 18 инструментов для LLM, чтобы работать с веб-страницами интерактивно. Эти инструменты работают с любой моделью, поддерживающей вызов инструментов. Система поддерживает как CLI, так и MCP (Model Context Protocol) интерфейсы.
Текущий статус и доступность
Это ранний проект версии 0.3, и разработчик ищет обратную связь. TideSurf доступен как npm-пакет (@tidesurf/core), с документацией на tidesurf.org/docs и исходным кодом на GitHub.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Разработчик OpenClaw достигает прорывов в области ИИ-агентов с автоматизацией бронирования Uber и ресторанов.
Разработчик OpenClaw успешно создал ИИ-агентов, которые автономно выполняют бронирование поездок в Uber и ресторанов на реальных веб-сайтах, обходя системы обнаружения ботов и CAPTCHA с использованием стека технологий, включающего скрытые браузеры, резидентские прокси и решения для CAPTCHA.

Pali v0.1: Открытая инфраструктура памяти для LLM с воспроизводимыми тестами производительности.
Pali — это инфраструктура памяти с открытым исходным кодом для больших языковых моделей, построенная на Go в виде единого бинарного файла с мультитенантными API, гибридным поиском и модульными расширениями. В релизе v0.1 добавлен набор тестов с воспроизводимыми результатами, показывающими метрики производительности для разных конфигураций.

ClawMetry добавляет удаленный мониторинг со сквозным шифрованием для агентов OpenClaw.
ClawMetry v0.1.0 теперь включает облачную синхронизацию для удаленного мониторинга агентов OpenClaw из любого браузера или приложения в строке меню Mac, со сквозным шифрованием, которое сохраняет данные зашифрованными до их получения вашим клиентом.

Навык Claude Code сочетает подходы DeepMind Aletheia и Anthropic harness.
Навык Claude Code реализует конвейер Планировщик→Генератор→Оценщик→Редактор, который синтезирует исследовательский математический агент Aletheia от DeepMind с многокомпонентной архитектурой кодирования от Anthropic, добавляя слепой предварительный анализ, где оценщик рассуждает о правильных подходах до просмотра кандидатного кода.