Два сбоя ИИ в одной демонстрации: Claude Code исправляет орфографию вместо ошибки схемы, OpenAI путает сопоставление пользовательских полей

✍️ OpenClawRadar📅 Опубликовано: 1 мая 2026 г.🔗 Source
Два сбоя ИИ в одной демонстрации: Claude Code исправляет орфографию вместо ошибки схемы, OpenAI путает сопоставление пользовательских полей
Ad

Во время семинара в Prismatic инженер в прямом эфире собрал B2B-интеграцию от начала до конца. Два ИИ-инструмента потерпели неудачу по-разному, иллюстрируя, что поведение реальных агентов хаотично и недетерминировано.

Claude Code: Решил не ту проблему

Claude Code за примерно 30 секунд создал каркас мастера настройки с использованием JSON Forms. Сгенерированный мастер выглядел нормально, но во время тестирования всплыла ошибка валидации JSON-схемы — что-то вроде "не должно содержать менее одного элемента". Когда инженер попросил Claude исправить это, агент следующие несколько минут вместо исправления ошибки схемы исправлял предупреждения об орфографии в файле. В конце концов инженер сказал: "надеюсь, это не ограничивается исправлением опечаток" и сдался, вставив код из черновика, сделанного накануне.

OpenAI: Мусор при первой попытке со странными полями

Интеграция вызывает OpenAI во время выполнения, чтобы сгенерировать сопоставления полей по умолчанию между схемой Salesforce клиента и целевым приложением. Для обычного контакта Salesforce (email-to-email, company-to-company) всё работало отлично — "скучно", по словам автора. Но для пользовательского типа записи с намеренно странными именами полей — Group name, Internet address, Physical place, Internet email address — первый вызов вернул мусор. Вторая попытка дала правильный результат.

Ad

Ключевые выводы

  • Скучные схемы недооценивают LLM — при их использовании агенты кажутся излишними. Странные, пользовательские случаи — вот где они проявляют себя, но большинство демонстраций избегают их для простоты.
  • Неудачи вживую полезнее успехов. Любой, кто работал с агентами, знает, что это хаос. Поведение "исправил орфографию вместо ошибки схемы" не предскажешь ни в какой документации.
  • Разные формы неудач: У Claude Code было всё необходимое, но он работал не над той проблемой. OpenAI "знал" ответ, но не выдал его с первого раза. Форма неудачи может подсказать, как развернуть каждый инструмент.

Автор работает в Prismatic, но не поделился ссылкой, сосредоточившись на возможности обучения, а не на саморекламе.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Папа Лев XIV «Величественное человечество»: Энциклика на 40 000 слов о разоружении в сфере ИИ
Новости

Папа Лев XIV «Величественное человечество»: Энциклика на 40 000 слов о разоружении в сфере ИИ

Папа Лев XIV выпускает Magnifica Humanitas, энциклику из 40 000 слов, призывающую к разоружению ИИ, критикующую автономное оружие, колониализм данных и технологические монополии. Сооснователь Anthropic присутствовал на презентации.

OpenClawRadar
Google Chrome устанавливает 4 ГБ ИИ-модель Gemini Nano молча – без согласия пользователя
Новости

Google Chrome устанавливает 4 ГБ ИИ-модель Gemini Nano молча – без согласия пользователя

Обнаружено, что Google Chrome незаметно загружает и устанавливает на устройства пользователей ИИ-модель Gemini Nano размером 4 ГБ без явного согласия, что вызывает опасения по поводу конфиденциальности и использования дискового пространства.

OpenClawRadar
Oracle рассматривает сокращение 20–30 тысяч рабочих мест и продажу Cerner для финансирования расширения центров обработки данных в сфере ИИ.
Новости

Oracle рассматривает сокращение 20–30 тысяч рабочих мест и продажу Cerner для финансирования расширения центров обработки данных в сфере ИИ.

Oracle рассматривает сокращение от 20 000 до 30 000 рабочих мест и продажу своего подразделения медицинского программного обеспечения Cerner, чтобы высвободить 8-10 миллиардов долларов денежного потока для расширения центров обработки данных в сфере ИИ, в то время как американские банки отказываются от финансирования инфраструктурного строительства компании на сумму 156 миллиардов долларов.

OpenClawRadar
Anthropic выпускает Blender MCP Connector – теперь Claude управляет Blender через Python API
Новости

Anthropic выпускает Blender MCP Connector – теперь Claude управляет Blender через Python API

Anthropic выпустил официальный MCP-коннектор для Blender, а также коннекторы для Adobe, Splice и SketchUp, позволяя Клоду в реальном времени создавать 3D-сцены по командам на естественном языке.

OpenClawRadar