Lightpanda: Открытый headless-браузер для LLM-агентов со встроенным MCP-сервером и выводом в формате markdown

Lightpanda — это открытый headless-браузер, специально разработанный для рабочих процессов агентов на основе LLM. Он решает проблему ресурсоёмкости традиционных браузеров, таких как Chrome, который потреблял 2 ГБ при 25 параллельных вкладках и тратил 47 секунд на обход 933 страниц в тестах. Lightpanda использует 215 МБ и завершает тот же тест за 5 секунд, пропуская рендеринг CSS, загрузку изображений и композицию GPU, которые не нужны LLM.
Ключевые возможности для рабочих процессов с LLM
- Нативный вывод в формате markdown: Работает внутри движка браузера, а не как этап постобработки. Агенты получают чистый, эффективный по токенам контент после выполнения JavaScript.
- Семантическое дерево с определением интерактивности: Вместо сырого HTML или скриншотов вы получаете обрезанный DOM с ролями, XPath и указанием, что действительно кликабельно. Поддерживает сжатый текстовый формат, разработанный для минимального использования токенов.
- Извлечение структурированных данных: JSON-LD, Open Graph и метатеги за один запрос.
- Нативный MCP-сервер: Встроен в бинарный файл с трёхстрочной конфигурацией для Claude, Cursor или любого MCP-клиента без необходимости в CDP-мосте.
Доступные инструменты MCP
MCP-сервер предоставляет следующие инструменты:
gotomarkdownsemantic_treeinteractiveElementsstructuredDatalinksevaluate(для произвольного JavaScript)
Этот инструмент предназначен для разработчиков, создающих агентов на основе LLM, которым требуется эффективное взаимодействие с вебом без накладных расходов на полный рендеринг браузера. Такой подход особенно полезен для веб-краулинга, извлечения данных и задач автоматизации, где агентам необходимо понимать и взаимодействовать с веб-контентом.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Сервер MCP индексирует кодовые базы в граф знаний для 10-кратного сокращения токенов
Новый MCP-сервер под названием codebase-memory-mcp анализирует кодовые базы в постоянный граф знаний с помощью tree-sitter, сокращая использование токенов как минимум в 10 раз для структурных запросов. Протестировано на 35 реальных репозиториях; он заменяет исследование файл за файлом на запросы к графу.

Создание голосовой мультиагентной системы на основе Claude Code
Разработчик создал голосовой интерфейс для Claude Code с активацией по ключевому слову, параллельными под-агентами, автоматическими проверками и отслеживанием процессов. Полный технический разбор с верификацией говорящего и PID-наблюдателем.

ClaudeClaw: Бесплатный плагин кода Claude для постоянных AI-агентов на мессенджер-платформах
ClaudeClaw — это бесплатный плагин Claude Code с открытым исходным кодом и лицензией MIT, который запускает Claude в качестве постоянного агента в Slack, WhatsApp и Telegram. Для работы требуется Node.js 20+, Claude Code и ваш собственный ключ API Anthropic, с изоляцией на уровне ОС через sandbox-runtime от Anthropic.

LLM-агент строит полноценный рогалик в Godot 4, используя визуальную обратную связь.
Разработчик подключил LLM-агента к Godot 4 с помощью инструмента MCP и дал ему одну инструкцию для создания dungeon crawler FPS. Агент создал полный прототип с 3 комнатами, освещением, боем, врагами и системой прогресса, запуская игру, делая скриншоты и исправляя визуальные проблемы.