Два сбоя ИИ в одной демонстрации: Claude Code исправляет орфографию вместо ошибки схемы, OpenAI путает сопоставление пользовательских полей

Во время семинара в Prismatic инженер в прямом эфире собрал B2B-интеграцию от начала до конца. Два ИИ-инструмента потерпели неудачу по-разному, иллюстрируя, что поведение реальных агентов хаотично и недетерминировано.
Claude Code: Решил не ту проблему
Claude Code за примерно 30 секунд создал каркас мастера настройки с использованием JSON Forms. Сгенерированный мастер выглядел нормально, но во время тестирования всплыла ошибка валидации JSON-схемы — что-то вроде "не должно содержать менее одного элемента". Когда инженер попросил Claude исправить это, агент следующие несколько минут вместо исправления ошибки схемы исправлял предупреждения об орфографии в файле. В конце концов инженер сказал: "надеюсь, это не ограничивается исправлением опечаток" и сдался, вставив код из черновика, сделанного накануне.
OpenAI: Мусор при первой попытке со странными полями
Интеграция вызывает OpenAI во время выполнения, чтобы сгенерировать сопоставления полей по умолчанию между схемой Salesforce клиента и целевым приложением. Для обычного контакта Salesforce (email-to-email, company-to-company) всё работало отлично — "скучно", по словам автора. Но для пользовательского типа записи с намеренно странными именами полей — Group name, Internet address, Physical place, Internet email address — первый вызов вернул мусор. Вторая попытка дала правильный результат.
Ключевые выводы
- Скучные схемы недооценивают LLM — при их использовании агенты кажутся излишними. Странные, пользовательские случаи — вот где они проявляют себя, но большинство демонстраций избегают их для простоты.
- Неудачи вживую полезнее успехов. Любой, кто работал с агентами, знает, что это хаос. Поведение "исправил орфографию вместо ошибки схемы" не предскажешь ни в какой документации.
- Разные формы неудач: У Claude Code было всё необходимое, но он работал не над той проблемой. OpenAI "знал" ответ, но не выдал его с первого раза. Форма неудачи может подсказать, как развернуть каждый инструмент.
Автор работает в Prismatic, но не поделился ссылкой, сосредоточившись на возможности обучения, а не на саморекламе.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Папа Лев XIV «Величественное человечество»: Энциклика на 40 000 слов о разоружении в сфере ИИ
Папа Лев XIV выпускает Magnifica Humanitas, энциклику из 40 000 слов, призывающую к разоружению ИИ, критикующую автономное оружие, колониализм данных и технологические монополии. Сооснователь Anthropic присутствовал на презентации.

Google Chrome устанавливает 4 ГБ ИИ-модель Gemini Nano молча – без согласия пользователя
Обнаружено, что Google Chrome незаметно загружает и устанавливает на устройства пользователей ИИ-модель Gemini Nano размером 4 ГБ без явного согласия, что вызывает опасения по поводу конфиденциальности и использования дискового пространства.

Oracle рассматривает сокращение 20–30 тысяч рабочих мест и продажу Cerner для финансирования расширения центров обработки данных в сфере ИИ.
Oracle рассматривает сокращение от 20 000 до 30 000 рабочих мест и продажу своего подразделения медицинского программного обеспечения Cerner, чтобы высвободить 8-10 миллиардов долларов денежного потока для расширения центров обработки данных в сфере ИИ, в то время как американские банки отказываются от финансирования инфраструктурного строительства компании на сумму 156 миллиардов долларов.

Anthropic выпускает Blender MCP Connector – теперь Claude управляет Blender через Python API
Anthropic выпустил официальный MCP-коннектор для Blender, а также коннекторы для Adobe, Splice и SketchUp, позволяя Клоду в реальном времени создавать 3D-сцены по командам на естественном языке.