AI Подпрограммы: Детерминированная автоматизация браузера с нулевой стоимостью токенов

Что делают AI Subroutines
AI Subroutines записывают действия в браузере один раз и сохраняют их как вызываемые инструменты, которые воспроизводятся с нулевой стоимостью токенов, нулевой задержкой LLM-инференса и со 100% детерминизмом. Сгенерированный скрипт выполняется внутри самой веб-страницы, а не через прокси, headless-воркер или внешнее решение.
Ключевое архитектурное решение
Скрипт выполняется в контексте исполнения веб-страницы, что означает автоматическое добавление всех аутентификационных данных, CSRF-токенов, TLS-сессий и подписанных заголовков в запросы. Не требуется установка сертификатов, модификация TLS-отпечатков или поддержка отдельного стека аутентификации.
Механизм записи
Во время записи расширение перехватывает сетевые запросы с использованием двух уровней:
- PATCH для fetch/XHR в MAIN-мире, устанавливаемый до запуска любых скриптов страницы
- API webRequest Chrome в качестве коррелированного резервного варианта для CORS и путей service-worker
Захватываются тела запросов, включая FormData, Blob и сырые байты, а не только JSON.
Обработка сетевого захвата
Система оценивает и сокращает примерно 300 запросов до около 5 на основе нескольких сигналов:
- Источник первого лица против третьего лица (+20 / −15)
- Известные хосты телеметрии (Sentry, Segment, Hotjar, RUM): −80
- Временная корреляция с DOM-событиями (+28 в пределах 800 мс, +16 в пределах 2,5 с)
- Метод и структура полезной нагрузки (изменяющие POST/PUT/PATCH/DELETE: +35; GET: +5; с телом запроса: +8)
- Качество ответа (2xx: +12; 4xx+: −25; непустое тело: +4)
- Волатильные идентификаторы операций (−18) для GraphQL queryId, doc_id, operationHash
Волатильные идентификаторы операций GraphQL активируют резервный вариант только с DOM, прежде чем они молча сломаются при следующем запуске.
Структура сгенерированного кода
Сгенерированный код объединяет сетевые вызовы с DOM-действиями (клик, ввод, поиск) в одной функции через пространство имён помощника rtrvr.*. Пять лучших ранжированных запросов плюс DOM-взаимодействия формируют контекст объёмом 12 000 символов для генератора.
Паттерн использования
Направьте AI-агент на таблицу из 500 строк, и всего одним вызовом LLM параметры назначаются, а 500 Subroutines запускаются.
Ключевые сценарии использования
- Запишите отправку DM в Instagram, затем используйте переиспользуемую рутину для отправки DM с нулевой стоимостью токенов
- Создайте рутину для получения последних продуктов в каталоге сайта, вызывайте её для получения тысяч продуктов через прямые GraphQL-запросы
- Настройте рутину для заполнения EHR-форм на основе параметров, с AI, выводящим параметры из текущего контекста страницы
- Переиспользуйте рутины ежедневно для синхронизации исходящих сообщений в LinkedIn/Slack/Gmail с CRM через MCP-сервер
Почему это важно
Фундаментальная проблема с браузерными агентами для повторяющихся задач заключается в том, что проходить через цикл инференса не нужно. Запись один раз и генерация LLM скрипта, который использует все возможные методы взаимодействия (прямые API-вызовы, DOM-взаимодействия, сторонние инструменты/API/MCP-серверы), обеспечивает детерминированную и экономичную автоматизацию.
📖 Read the full source: HN LLM Tools
👀 Смотрите также

Савант Коммандер 48B: Пользовательская модель Qwen 3 со смесью экспертов, включающая 12 дистиллированных моделей
Savant Commander 48B — это кастомная модель Qwen 3 с архитектурой Mixture-of-Experts (MOE), использующая ручную маршрутизацию и объединяющая 12 дистиллированных моделей от таких провайдеров, как Claude, Gemini, OpenAI и Deepseek. Она поддерживает контекст длиной 256K и позволяет активировать конкретные дистиллированные модели по запросу.

Отслеживаемые 5 крупнейших коллекций Claude Code SKILL.md на GitHub — сортируемая таблица с автообновлением
Создал сортируемую таблицу пяти лучших репозиториев с коллекциями навыков (в сумме 125k звезд) с количеством звезд и навыков, автоматически обновляемую по команде /workflows:skill-collections.

Результаты PinchBench: Первый эталонный тест для ИИ-агентов кодирования, специфичных для OpenClaw
Первый специализированный бенчмарк OpenClaw, PinchBench, ранжирует 32 модели ИИ по проценту успешных решений, стоимости и скорости, где Google Gemini-3-Flash-Preview лидирует с 95,1% успеха за $0,72.

SubQ: Субквадратичная языковая модель с контекстным окном в 12 миллионов токенов
SubQ — это полностью субквадратичная разреженная LLM, обеспечивающая окно контекста в 12 млн токенов при скорости 150 токенов/с, с показателями SWE-Bench Verified 81.8% и RULER @ 128K 95.0%. Она уменьшает вычислительные затраты на внимание примерно в 1000 раз по сравнению с трансформерами.