Google Surf MCP: бесплатный MCP-сервис для поиска Google с поддержкой PDF и многоуровневым извлечением

✍️ OpenClawRadar📅 Опубликовано: 15 мая 2026 г.🔗 Source
Google Surf MCP: бесплатный MCP-сервис для поиска Google с поддержкой PDF и многоуровневым извлечением
Ad

Google Surf MCP — это бесплатный MCP-сервер для поиска в Google и извлечения URL-адресов, который действительно работает — автор сообщает, что протестировал 6 бесплатных MCP, все из которых не сработали. Он заменяет обычную комбинацию поискового MCP и fetch MCP единым набором инструментов, который также автоматически обрабатывает академические PDF (arXiv, bioRxiv, Nature, OpenReview, NeurIPS, JMLR, PMLR, Springer, PubMed→PMC).

Ключевые особенности

  • 4 инструмента: search (только SERP), search_parallel (N параллельных запросов), extract(url, mode?) (полный/аннотация/метаданные), search_extract(query, mode?) (по умолчанию аннотация)
  • Многоуровневое извлечение: mode: "abstract" возвращает около 1500 символов на результат для дешевой проверки релевантности перед оплатой полного текста. Обзор из 5 результатов стоит около 7,5 тыс. символов вместо 40 тыс.
  • Определение PDF: через Content-Type, магические байты %PDF, мета-тег citation_pdf_url и правила для каждого домена.
  • Надежность: многостратегический парсер SERP с геометрической верификацией (отбрасывает спонсируемые/панель знаний/сайдбар), защита от SSRF (блокировка частных/петлевых адресов через переменные окружения, защита от DNS rebinding, проверка перенаправлений на каждом шаге), лимит загрузки 25 МБ, некорректные PDF обрабатываются как ошибка.
  • Автовосстановление CAPTCHA: при появлении CAPTCHA открывается видимое окно Chrome для решения человеком, затем происходит повторная попытка. Репутация профиля в Google сохраняется.
  • Без API-ключа, без прокси, без решатора.
Ad

Стек и скорость

  • Стек: TypeScript, Playwright + stealth, Readability, Turndown, unpdf. ~900 строк кода.
  • Скорость (1 Гбит/с): последовательно ~1,5 с/запрос (прогретый), 4 параллельно ~2 с общего времени, 10 параллельно ~5 с общего времени.

Пример использования

search_extract("последние научные статьи по ИИ", mode: "abstract")

Возвращает аннотации топ-результатов, позволяя агенту оценить релевантность перед вызовом extract(url, mode: "full") для лучшего результата.

Для кого это: Разработчики, создающие AI-агентов, которым нужен надежный, бесплатный веб-поиск и извлечение данных без внешних API-ключей или платных сервисов.

📖 Читать полный исходник: r/ClaudeAI

Ad

👀 Смотрите также

Как ИИ-ассистенты получают веб-страницы: анализ логов Nginx для ChatGPT, Claude, Gemini и других
Инструменты

Как ИИ-ассистенты получают веб-страницы: анализ логов Nginx для ChatGPT, Claude, Gemini и других

Разработчик протестировал пять основных ИИ-ассистентов, предоставляя им уникальные URL-адреса и отслеживая логи Nginx, что выявило различные модели получения данных: ChatGPT, Claude и Perplexity используют специальные user-agent, в то время как Gemini отвечал из своего индекса без получения данных.

OpenClawRadar
Мурмура: Открытый демон Cron для автоматизации сеансов кодирования с Claude
Инструменты

Мурмура: Открытый демон Cron для автоматизации сеансов кодирования с Claude

Murmur — это демон cron, который планирует и автоматизирует сеансы кода Claude с использованием файла HEARTBEAT.md для настройки.

OpenClawRadar
HomeButler: Управление домашней лабораторией без использования токенов для агентов OpenClaw
Инструменты

HomeButler: Управление домашней лабораторией без использования токенов для агентов OpenClaw

HomeButler — это единый бинарный файл на Go, который позволяет агентам OpenClaw управлять инфраструктурой домашней лаборатории без API-ключей или токенов. Он работает локально и сохраняет все операции в вашей сети.

OpenClawRadar
Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу
Инструменты

Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу

Cortex — это инструмент с открытым исходным кодом для работы с памятью, созданный для решения проблем сжатия контекста у агентов OpenClaw. Он реализует кривые забывания Эббингауза для угасания фактов, сначала импортирует данные из файлов и работает как один 19-мегабайтный бинарный файл Go с SQLite.

OpenClawRadar