Google Surf MCP: бесплатный MCP-сервис для поиска Google с поддержкой PDF и многоуровневым извлечением

Google Surf MCP — это бесплатный MCP-сервер для поиска в Google и извлечения URL-адресов, который действительно работает — автор сообщает, что протестировал 6 бесплатных MCP, все из которых не сработали. Он заменяет обычную комбинацию поискового MCP и fetch MCP единым набором инструментов, который также автоматически обрабатывает академические PDF (arXiv, bioRxiv, Nature, OpenReview, NeurIPS, JMLR, PMLR, Springer, PubMed→PMC).
Ключевые особенности
- 4 инструмента:
search(только SERP),search_parallel(N параллельных запросов),extract(url, mode?)(полный/аннотация/метаданные),search_extract(query, mode?)(по умолчанию аннотация) - Многоуровневое извлечение:
mode: "abstract"возвращает около 1500 символов на результат для дешевой проверки релевантности перед оплатой полного текста. Обзор из 5 результатов стоит около 7,5 тыс. символов вместо 40 тыс. - Определение PDF: через Content-Type, магические байты %PDF, мета-тег citation_pdf_url и правила для каждого домена.
- Надежность: многостратегический парсер SERP с геометрической верификацией (отбрасывает спонсируемые/панель знаний/сайдбар), защита от SSRF (блокировка частных/петлевых адресов через переменные окружения, защита от DNS rebinding, проверка перенаправлений на каждом шаге), лимит загрузки 25 МБ, некорректные PDF обрабатываются как ошибка.
- Автовосстановление CAPTCHA: при появлении CAPTCHA открывается видимое окно Chrome для решения человеком, затем происходит повторная попытка. Репутация профиля в Google сохраняется.
- Без API-ключа, без прокси, без решатора.
Стек и скорость
- Стек: TypeScript, Playwright + stealth, Readability, Turndown, unpdf. ~900 строк кода.
- Скорость (1 Гбит/с): последовательно ~1,5 с/запрос (прогретый), 4 параллельно ~2 с общего времени, 10 параллельно ~5 с общего времени.
Пример использования
search_extract("последние научные статьи по ИИ", mode: "abstract")
Возвращает аннотации топ-результатов, позволяя агенту оценить релевантность перед вызовом extract(url, mode: "full") для лучшего результата.
Для кого это: Разработчики, создающие AI-агентов, которым нужен надежный, бесплатный веб-поиск и извлечение данных без внешних API-ключей или платных сервисов.
📖 Читать полный исходник: r/ClaudeAI
👀 Смотрите также

Как ИИ-ассистенты получают веб-страницы: анализ логов Nginx для ChatGPT, Claude, Gemini и других
Разработчик протестировал пять основных ИИ-ассистентов, предоставляя им уникальные URL-адреса и отслеживая логи Nginx, что выявило различные модели получения данных: ChatGPT, Claude и Perplexity используют специальные user-agent, в то время как Gemini отвечал из своего индекса без получения данных.

Мурмура: Открытый демон Cron для автоматизации сеансов кодирования с Claude
Murmur — это демон cron, который планирует и автоматизирует сеансы кода Claude с использованием файла HEARTBEAT.md для настройки.

HomeButler: Управление домашней лабораторией без использования токенов для агентов OpenClaw
HomeButler — это единый бинарный файл на Go, который позволяет агентам OpenClaw управлять инфраструктурой домашней лаборатории без API-ключей или токенов. Он работает локально и сохраняет все операции в вашей сети.

Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу
Cortex — это инструмент с открытым исходным кодом для работы с памятью, созданный для решения проблем сжатия контекста у агентов OpenClaw. Он реализует кривые забывания Эббингауза для угасания фактов, сначала импортирует данные из файлов и работает как один 19-мегабайтный бинарный файл Go с SQLite.