Разработчик OpenClaw достигает прорывов в области ИИ-агентов с автоматизацией бронирования Uber и ресторанов.

Разработчик OpenClaw добился значительного прогресса в области автоматизации браузеров, преодолев ограничения, которые ранее мешали ИИ-агентам взаимодействовать с реальными веб-сайтами. Разработчик успешно создал агентов, способных автономно выполнять сложные задачи на работающих сайтах без использования заранее подготовленных демонстраций.
Что сейчас действительно работает
Разработчик добился успешного выполнения полных процессов на двух крупных платформах:
- Uber: Агент открывает приложение, вводит места отправления и назначения, выбирает тип поездки и доходит до экрана подтверждения
- Бронирование ресторанов: Агент находит ресторан, заполняет формы бронирования и подтверждает заказы
Это не заранее подготовленные демонстрации. Агенты перемещаются по реальным веб-сайтам, работают с динамическими элементами и успешно обходят системы обнаружения ботов.
Текущий технический стек
Рабочее решение состоит из нескольких интегрированных компонентов:
- Скрытый браузер с постоянными профилями и снятием цифровых отпечатков
- Маршрутизация через резидентские прокси
- Интеграция решений для CAPTCHA
Разработчик отмечает, что это функционально, но ещё не отполированный продукт — в настоящее время это «куча частей, склеенных вместе, требующих ручной настройки».
Направление разработки и мнение сообщества
Разработчик хочет превратить этот прототип в нечто, пригодное для использования любым пользователем OpenClaw, но ищет отзывы сообщества перед созданием «идеальной» версии. Долгосрочное видение — «установить навык, ваш агент получает полную браузерную среду с вашими сохранёнными сессиями, и он может автономно выполнять действия в интернете».
Для ближайшей разработки разработчик задаёт сообществу конкретные вопросы:
- Какие конкретные задачи автоматизации не удались из-за ограничений браузера?
- Какие сайты/сервисы вы хотели бы, чтобы ваш агент мог использовать? (Uber, Airbnb, LinkedIn, государственные порталы, доставка еды и т.д.)
- Какой формат был бы наиболее полезен прямо сейчас?
Разработчик предлагает несколько вариантов формата для рассмотрения сообществом:
- a) Навык OpenClaw, который даёт вашему агенту скрытый браузер
- b) Автономный инструмент, который вы запускаете на VPS и подключаете к нему своего агента
- c) Настольное браузерное приложение, которое из коробки обрабатывает защиту от обнаружения, сессии и цифровые отпечатки
- d) Просто руководство по настройке, чтобы вы могли самостоятельно соединить части
- e) Что-то ещё
Разработчик также спрашивает, согласились бы пользователи с требованием VPS или им нужна функциональность на локальной машине.
📖 Прочитать полный источник: r/openclaw
👀 Смотрите также

AGENTS.md Схема для компилируемых ИИ-системами баз знаний со слоем обучения
AGENTS.md v1.0 предоставляет стандарт схемы для Claude, позволяющий создавать и поддерживать персональные исследовательские вики из исходных материалов, включая слой обучения с интервальным повторением с автоматической генерацией карточек и отслеживанием пробелов в знаниях.

Три репозитория для разработки RAG и AI-агентов
В посте на Reddit выделены три репозитория для разработчиков, работающих с RAG и AI-агентами: memvid для памяти агентов, llama_index для RAG-пайплайнов и Continue для ассистентов программирования. Автор отмечает, что чистый RAG лучше всего подходит для извлечения знаний, в то время как системы памяти лучше для агентов, а гибридные подходы часто используются в реальных инструментах.

Сравнение 14 вариантов ИИ-агента Claw по 10 категориям
Подробное сравнение 14 популярных вариантов агентов Claw AI, включая OpenClaw, NanoClaw, NemoClaw, ZeroClaw, PicoClaw, Moltis, IronClaw и NullClaw, с оценкой по 53 подпараметрам, составными рейтингами и идеальными вариантами использования для каждого.

Реальные инсайты по использованию OpenClaw с LLM: проблемы и ограничения
Пользователь OpenClaw описывает проблемы интеграции с LLM, отмечая бессмысленные ответы от Discord-бота.