API браузера WebMCP могут сократить потребность в веб-скрапинге для ИИ-агентов.

Что меняет WebMCP для веб-автоматизации
Google недавно выпустил WebMCP — два новых API браузера, которые позволяют веб-сайтам регистрировать инструменты для прямого вызова AI-агентами. Вместо парсинга DOM-элементов или борьбы с антибот-системами сайты могут предоставлять свою функциональность через стандартизированные интерфейсы.
Как это работает технически
Сайты регистрируют инструменты с помощью navigator.modelContext.registerTool(), указывая название, описание, схему входных данных и функцию выполнения. В источнике приведён такой пример:
navigator.modelContext.registerTool({
name: "search_flights",
description: "Поиск доступных рейсов",
inputSchema: { /* JSON Schema */ },
execute: async (input) => {
return await internalFlightAPI(input);
}
});Этот подход устраняет цепочки CSS-селекторов, логику повторных попыток, управление headless-сессиями браузера и парсинг DOM для любого сайта, реализующего WebMCP.
Текущий статус реализации
Спецификация всё ещё на ранней стадии — черновик W3C содержит буквальные комментарии "TODO: fill this out" в определениях методов. Сейчас это доступно только в Chrome 146 как ранняя предварительная версия. Автор подписался на ранний доступ, чтобы протестировать, какую часть существующего кода парсинга можно заменить.
Практические последствия для разработчиков
Для разработчиков, уже создающих MCP-серверы, ментальная модель идентична: инструменты + схемы + выполнение. Переход от предоставления локальных ресурсов как MCP-инструментов к тому, чтобы сайты предоставляли себя как MCP-инструменты, невелик — та же архитектура, другой транспорт.
Крупные сайты с существующими внутренними API (такие как Booking, Amazon, авиакомпании), вероятно, внедрят первыми, поскольку могут предоставить свои API через WebMCP с минимальными изменениями. Парсеры не исчезнут полностью — сайты без реализации WebMCP всё ещё потребуют традиционных подходов.
Автор предлагает многоуровневый подход: агенты сначала пробуют WebMCP, затем переходят к DOM-автоматизации при недоступности, а затем к прямому парсингу как последнему средству — используя лучший доступный метод для каждого сайта.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Результаты тестирования APEX Benchmark: производительность Qwen 3.5 в реальных задачах программирования
Результаты тестирования APEX показывают производительность моделей Qwen 3.5 на 70 реальных задачах по программированию с GitHub. Версия 397B опускается до 1194 ELO на задачах уровня «мастер», в то время как GLM-4.7 в квантованном виде лидирует среди локальных моделей с 1572 ELO.

LLMock: HTTP-сервер для мокинга, обеспечивающий детерминированное тестирование LLM между процессами
LLMock — это реальный HTTP-сервер, который мокает API OpenAI, Claude и Gemini, позволяя разработчикам запускать детерминированные тесты в нескольких процессах без обращения к реальным API. Он поддерживает SSE-стриминг, вызовы инструментов, предикатную маршрутизацию и журналирование запросов без зависимостей.

Холисто Сид: Локальная структура LLM с постоянной идентичностью и консенсусной консолидацией памяти
Holisto Seed — это фреймворк реляционной индивидуации, который предоставляет LLM-агентам постоянную идентичность, биографическую память и коэволюционные отношения с пользователями. Он работает полностью локально с системой версионирования на основе Git и включает согласованный цикл сна для консолидации памяти.

开发者用每千次提示中的咒骂次数指标追踪沮丧情绪,涉及44,212条Claude Code日志
Разработчик отслеживал 'fpk' (f-бомбы на тысячу промптов) по 44 212 промптам Claude Code за 5 месяцев и обнаружил, что уровень разочарования снизился в 3,4 раза с Claude Opus 4-5 до 4-7, причем большая часть ругательств была направлена на инструменты окружения, а не на модель.