Сбои ИИ: Claude Code исправляет орфографию вместо схемы

Во время семинара в Prismatic инженер в прямом эфире собрал B2B-интеграцию от начала до конца. Два ИИ-инструмента потерпели неудачу по-разному, иллюстрируя, что поведение реальных агентов хаотично и недетерминировано.

Claude Code: Решил не ту проблему

Claude Code за примерно 30 секунд создал каркас мастера настройки с использованием JSON Forms. Сгенерированный мастер выглядел нормально, но во время тестирования всплыла ошибка валидации JSON-схемы — что-то вроде "не должно содержать менее одного элемента". Когда инженер попросил Claude исправить это, агент следующие несколько минут вместо исправления ошибки схемы исправлял предупреждения об орфографии в файле. В конце концов инженер сказал: "надеюсь, это не ограничивается исправлением опечаток" и сдался, вставив код из черновика, сделанного накануне.

OpenAI: Мусор при первой попытке со странными полями

Интеграция вызывает OpenAI во время выполнения, чтобы сгенерировать сопоставления полей по умолчанию между схемой Salesforce клиента и целевым приложением. Для обычного контакта Salesforce (email-to-email, company-to-company) всё работало отлично — "скучно", по словам автора. Но для пользовательского типа записи с намеренно странными именами полей — Group name, Internet address, Physical place, Internet email address — первый вызов вернул мусор. Вторая попытка дала правильный результат.

Ключевые выводы

Скучные схемы недооценивают LLM — при их использовании агенты кажутся излишними. Странные, пользовательские случаи — вот где они проявляют себя, но большинство демонстраций избегают их для простоты.
Неудачи вживую полезнее успехов. Любой, кто работал с агентами, знает, что это хаос. Поведение "исправил орфографию вместо ошибки схемы" не предскажешь ни в какой документации.
Разные формы неудач: У Claude Code было всё необходимое, но он работал не над той проблемой. OpenAI "знал" ответ, но не выдал его с первого раза. Форма неудачи может подсказать, как развернуть каждый инструмент.

Автор работает в Prismatic, но не поделился ссылкой, сосредоточившись на возможности обучения, а не на саморекламе.

📖 Read the full source: r/ClaudeAI

Два сбоя ИИ в одной демонстрации: Claude Code исправляет орфографию вместо ошибки схемы, OpenAI путает сопоставление пользовательских полей

Claude Code: Решил не ту проблему

OpenAI: Мусор при первой попытке со странными полями

Ключевые выводы

👀 Смотрите также

Папа Лев XIV «Величественное человечество»: Энциклика на 40 000 слов о разоружении в сфере ИИ

Google Chrome устанавливает 4 ГБ ИИ-модель Gemini Nano молча – без согласия пользователя

Oracle рассматривает сокращение 20–30 тысяч рабочих мест и продажу Cerner для финансирования расширения центров обработки данных в сфере ИИ.

Anthropic выпускает Blender MCP Connector – теперь Claude управляет Blender через Python API