Снижение соответствия системному промпту Claude в длинных беседах

Пользователь Reddit сообщает, что соблюдение системных промптов Claude значительно ухудшается в длинных беседах, особенно это затрагивает ИИ-агентов для программирования с конкретными правилами форматирования и ограничениями.
Детали проблемы
Пользователь запускает несколько агентов на основе Claude для внутренних инструментов, каждый с системными промптами, содержащими конкретные правила о формате вывода, темах, которых следует избегать, и обработке крайних случаев. Хотя они работают идеально в первые 20-30 обменов, соблюдение начинает снижаться примерно на 40-50 сообщении.
Конкретные наблюдаемые проблемы:
- Агенты перестают следовать правилам форматирования
- Они становятся «полезными» способами, которые системный промпт явно запрещает
- Они забывают ограничения, которые были ясны в начале
Пользователь отмечает, что это не ошибка, а скорее то, как работают контекстные окна под нагрузкой, когда системные промпты конкурируют с 40+ сообщениями истории диалога за внимание.
Обходные пути и решения
Пользователь делится несколькими практическими подходами, которые сработали:
- Повторение критических правил: Каждые 15-20 сообщений повторяйте 3 главных правила, которые нельзя потерять, в сжатой форме (не полный системный промпт)
- Сокращение бесед: Если задача требует более 30 обменов, начните новую сессию с краткого изложения произошедшего
- Стратегическое размещение промптов: Поместите самые важные ограничения как в начало, так и в конец системного промпта, поскольку модели уделяют больше внимания обеим позициям
- Тестирование в масштабе: Тестируйте своих агентов на 50 сообщении, а не только на 5, поскольку демонстрации успешного сценария не выявляют эту проблему
Пользователь подчеркивает, что об этой проблеме говорят недостаточно, и приглашает других поделиться надежными шаблонами для сохранения следования инструкциям в длительных сессиях.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Клод Код внезапно становится осторожным, запрашивая разрешение на рутинные задачи
Пользователь сообщает, что Claude Code периодически переключается с автономного выполнения на запрос чрезмерных разрешений даже для ежедневных, неизменных рабочих процессов, таких как пересборка монорепозитория и запуск тестов.

100 000 «почему» ИИ: как квазидетерминированные выходные данные LLM создают узнаваемую халтуру
lcamtuf утверждает, что вывод LLM можно отличить от человеческого письма не по отдельным особенностям, а по квазидетерминированному повторению одних и тех же сложных паттернов во многих запросах. Обложки книг Amazon для «100000 почему» иллюстрируют этот момент.

Опасно пропускать чтение кода: когда LLM пишут код быстрее, чем вы можете его прочитать
Что, если перестать проверять код, сгенерированный LLM, и относиться к нему как к машинному? Перенести строгость на спецификации и тесты.

Пин версий, список плагинов, улучшения хуков и критически важные исправления ошибок в Claude Code v2.1.163
Claude Code v2.1.163 добавляет управляемые настройки requiredMinimumVersion/requiredMaximumVersion, команду /plugin list, улучшения контекста хуков и исправления для зависаний claude -p, ошибки EEXIST в Windows и регрессии Bazel/EDR.