Песочница для агентов: устойчивое выполнение и холодные старты

В блоге Mendral утверждается, что обвязка агента — цикл, который управляет LLM, отправляя промпты, выполняя вызовы инструментов и возвращая результаты обратно, — должна работать вне песочницы, особенно для многопользовательских агентов. Они сравнивают две архитектуры и детально описывают три проблемы, которые решили при переходе на внешнюю модель.
Две архитектуры
- Обвязка внутри песочницы: Цикл находится в том же контейнере, что и код, с которым он работает. Вызовы инструментов (bash, read, write) выполняются локально. Навыки и память — это файлы в файловой системе контейнера. Так работает Claude Code локально. Простая модель выполнения, но учетные данные находятся внутри песочницы, песочница является сессией (ее потеря приводит к потере прогресса), а многопользовательский режим превращается в проблему распределенной файловой системы.
- Обвязка вне песочницы: Цикл выполняется на бэкенде и вызывает песочницу через API для выполнения инструментов. Учетные данные остаются за пределами песочницы (модель разрешений не нужна). Песочницы можно приостанавливать при простое, они становятся скотом (переживают сбои), а многопользовательское совместное использование — это проблема общей базы данных, а не распределенной файловой системы.
Три решенные проблемы
- Устойчивое выполнение: Сессии агента могут длиться часами и должны переживать развертывания и сбои. Mendral использует Inngest для контрольных точек — каждый шаг является шагом, и цикл продолжает с того места, где остановился, если сервер перезагружается.
- Жизненный цикл песочницы с низким холодным стартом: Цикл большую часть времени приостановлен (например, во время вызовов LLM). Они используют Blaxel для возобновления песочниц из режима ожидания за ~25 мс, избегая секундного холодного старта во время интерактивных шагов.
- Абстракция файловой системы: Поскольку обвязка и песочница находятся на разных машинах, общая файловая система больше недоступна. Mendral отмечает, что им пришлось решать эту проблему, но в статье основное внимание уделяется первым двум как ключевым решенным проблемам.
В статье делается вывод, что внешняя модель превосходит для многопользовательских конфигураций, несмотря на сложность устойчивого выполнения и обработки холодного старта.
📖 Read the full source: HN AI Agents
👀 Смотрите также
Qwen3 27B превосходит Gemma 4 26B в реальном вызове инструментов для локального AI-видеопаплайна
Эксперимент с локальным AI-видеопайплайном показывает, что Qwen3 27B чисто обрабатывает вызовы инструментов, тогда как Gemma 4 26B застревает в циклах. Также рассматриваются Said Image Turbo для локальной генерации изображений и оркестрация OpenCode с контекстом 174K.

Anthropic запускает 10 финансовых AI-агентов для питчбуков, KYC и закрытия месяца
Anthropic выпустила 10 готовых к работе ИИ-агентов для финансовых услуг и страхования, охватывающих создание питчбуков, проверку KYC и закрытие месяца, поставляемых через Claude Cowork, Claude Code и Managed Agents.

Гибридная архитектура ИИ: компоненты с открытым исходным кодом и проприетарные модели логического вывода
Практическая гибридная архитектура ИИ становится реальностью: 89% организаций используют компоненты с открытым исходным кодом для снижения затрат более чем на 50%, в то время как проприетарные модели справляются со сложными задачами логического вывода. Фреймворки с открытым исходным кодом предлагают прозрачность и возможности тонкой настройки без переговоров о лицензировании.

Заявления компании Medvi об искусственном интеллекте стоимостью 1,8 млрд долларов подвергаются проверке из-за юридических и этических вопросов.
Гэри Маркус критикует вирусную историю о Medvi, компании, которая, как утверждается, является ИИ-компанией стоимостью 1,8 млрд долларов, созданной одним человеком за два месяца, указывая на коллективные иски за нарушения правил рассылки спама и задавая вопросы о предоставлении отчетности о доходах и соблюдении нормативных требований.