Агенты ИИ предпочитают структурированные запросы вместо естественного языка в тесте сервера Cala MCP.

Команда Cala недавно выпустила MCP-сервер, который предоставляет три различных способа доступа AI-агентов к их графу знаний: запросы на естественном языке, структурированный язык запросов и прямое обход сущностей/связей.
Неожиданное поведение агентов
Несмотря на ожидания, что агенты по умолчанию будут использовать интерфейсы на естественном языке (типичная сильная сторона LLM), большинство агентов отказались от запросов на естественном языке в течение нескольких минут. Без каких-либо подсказок или направлений они автономно переключились на использование структурированных запросов и методов обхода графа.
Почему это логично
Источник объясняет это поведение, отмечая, что LLM не обучаются явно быть «эффективными», а скорее быть корректными через RLHF. Эта корректность приводит к эффективному поведению как побочному эффекту — агенты учатся выбирать кратчайший надёжный путь к решениям. Интерфейсы на естественном языке добавляют слой интерпретации, который вносит неопределённость, в то время как структурированные запросы обеспечивают детерминированные результаты.
Когда им представили три способа доступа, агенты последовательно выбирали вариант, который минимизировал неопределённость, а не самый «естественный» интерфейс.
Ключевые вопросы
- Не слишком ли мы полагаемся на интерфейсы естественного языка для инструментов агентов?
- Должны ли MCP-серверы по умолчанию отдавать приоритет структурированным/графовым методам доступа над естественным языком?
- Если агенты предпочитают детерминированные пути, как это должно влиять на дизайн инструментов?
Обсуждение на Reddit ищет мнения других разработчиков инструментов для агентов, чтобы узнать, наблюдали ли они похожие паттерны.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Рост экосистемы OpenClaw и ключевые участники на карте
Участник сообщества составил карту стремительного расширения экосистемы OpenClaw, отметив более 230 тысяч звёзд на GitHub, более 116 тысяч участников в Discord и появление компаний в сферах управляемого хостинга, маршрутизации LLM и слоёв безопасности в течение 60 дней с момента запуска.

Тестирование OpenClaw на UmbrelOS: Что нужно знать
Интеграция OpenClaw с UmbrelOS находится на стадии изучения, что может предложить новую среду для усовершенствованных инструментов кодирования с использованием ИИ.

Настройка субагентов в OpenClaw: ключевые моменты
Пользователи, экспериментирующие с OpenClaw, сталкиваются с проблемами при настройке субагентов, особенно при модификации JSON-файлов.

Claude Code v2.1.73: Переопределения моделей, исправления стабильности и улучшения производительности
Claude Code v2.1.73 добавляет modelOverrides для пользовательских идентификаторов провайдеров, исправляет критические зависания и взаимные блокировки, решает проблему понижения версий моделей у суб-агентов и улучшает стабильность голосового режима. В выпуске устранены 18 конкретных проблем, включая запросы разрешений для bash-команд, повреждение сессий и сбои песочницы Linux.