Claude Managed Agents добавляет возможность мечтать, результаты, мультиагентную оркестрацию и вебхуки

Anthropic выпустила несколько новых функций для Claude Managed Agents, теперь доступных на платформе Claude. Мечтание (предварительная версия исследования) — это запланированный фоновый процесс, который анализирует предыдущие сеансы агента, извлекает шаблоны поведения и результатов и соответствующим образом обновляет память. Harvey показал примерно 6-кратное улучшение показателя выполнения задач с включённым Мечтанием.
Ключевые функции
- Мечтание: Автоматическое курирование памяти, выполняемое по расписанию. Агенты со временем улучшаются, извлекая шаблоны из прошлых сеансов. В настоящее время в предварительной версии исследования — запросите доступ по адресу claude.com/form/claude-managed-agents.
- Результаты: Определите оценочную рубрику; отдельный оценщик проверяет вывод агента на её соответствие. Агент повторяет попытки, пока рубрика не будет удовлетворена, затем уведомляет вас через вебхук.
- Многопользовательская оркестрация: Ведущий агент может делегировать подзадачи специализированным агентам, которые выполняются параллельно, что позволяет одновременно работать над сложными заданиями.
- Вебхуки: Получайте уведомления о достижении результата или других событиях жизненного цикла.
Результаты, многопользовательская оркестрация и вебхуки теперь доступны в открытой бета-версии. Чтобы начать, посетите платформу Claude.
📖 Читайте полный источник: r/ClaudeAI
👀 Смотрите также

OpenClaw 4.2 исправляет ошибку сопряжения и добавляет устойчивые потоки задач.
OpenClaw 4.2 исправляет ошибку сопряжения, затронувшую пользователей, обновившихся около 31 марта, и представляет устойчивые потоки задач, позволяющие длительным задачам переживать разрывы соединения с шлюзом.

DeepSeek-V4 Pro и Flash: 1,6 трлн параметров, контекст в 1 млн токенов, гибридное внимание
DeepSeek-V4-Pro (1,6 трлн параметров, 49 млрд активных) и V4-Flash (284 млрд параметров, 13 млрд активных) поддерживают контекст в 1 млн токенов. Новое гибридное внимание (CSA + HCA) снижает FLOPs при инференсе одного токена до 27% и KV-кэш до 10% от DeepSeek-V3.2.

Claude Opus 4.1 набирает 17.75% на приватном наборе данных SWE-Bench Pro, что подчеркивает разрыв между запоминанием и логическим мышлением.
Claude Opus 4.1 набрал 80% на SWE-Bench Verified, но упал до 17,75% на приватном наборе данных SWE-Bench Pro, состоящем из 276 задач из 18 проприетарных кодбейсов стартапов. Анализ Scale AI показал, что модели ориентировались по памяти, а не рассуждали на знакомых репозиториях.

Выпущена модель Mistral Medium 3.5 128B: плотная модель с настраиваемым рассуждением и зрением
Mistral AI выпустила Mistral Medium 3.5 — плотную модель на 128B с контекстом 256k, настраиваемым уровнем рассуждений и возможностями распознавания изображений, под модифицированной лицензией MIT.