Политический фильтр Claude блокирует биоинформатическую работу с названиями патогенов.

Постдок в области вычислительной вирусологии сообщает о постоянных проблемах с фильтром политики использования Claude при написании скриптов для филогенетических пайплайнов в биоинформатических работах. Исследователь использует Claude для задач обработки последовательностей и метаданных.
Конкретное поведение модели
Ошибка нарушения политики возникает при упоминании патогенов по имени в скриптах. Это происходит на нескольких платформах и моделях:
- Затронутые платформы: Claude Code и claude.ai
- Затронутые модели: Opus 4.6 и Sonnet 4.6
- Только Sonnet 4 не помечает тот же контент
Текущие обходные пути
Исследователь определил два функциональных метода обхода:
- Описывать биоинформатическую задачу без указания конкретного организма
- Добавлять название организма во вложенных файлах вместо текста промпта
- Переходить на Sonnet 4, хотя это означает, что платящие пользователи не могут получить доступ к последним моделям без обходных путей
Пробел в политике для исследователей
Сообщается, что у Anthropic есть форма исключения для случаев кибербезопасности для исследователей безопасности, сталкивающихся с аналогичными ложными срабатываниями фильтров политики. Однако не существует эквивалентного процесса исключения для биологов или геномиков, работающих с патогенами в законных исследовательских контекстах.
Исследователь призывает других специалистов в области геномики или биоинформатики инфекционных заболеваний, сталкивающихся с аналогичными ложными срабатываниями, повысить осведомленность об этой проблеме.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также
Opus 4.7 может следовать ~500 инструкциям, по сравнению с ~150 год назад
Исследование, обновленное в мае 2026 года, показывает, что Opus 4.7 может надежно следовать примерно 500 инструкциям, по сравнению с примерно 150 в июле 2025 года. GPT-5.5 справляется примерно с 5000. Последствия для размера файла CLAUDE.md.

Утечка данных раскрыла модель искусственного интеллекта Claude Mythos от Anthropic, которую описывают как «скачок» в возможностях.
Anthropic тестирует новую модель ИИ под названием Claude Mythos (также известную как Capybara), которая представляет собой «качественный скачок» в производительности. По сравнению с Claude Opus 4.6, она демонстрирует значительно более высокие результаты в тестах на написание программного кода, академическое мышление и кибербезопасность. Существование модели было раскрыто в результате утечки данных из незащищенного, общедоступного кэша, содержащего около 3000 неопубликованных материалов.

Работники Amazon придумывают имитацию работы для выполнения квот по использованию ИИ
Чтобы соответствовать внутренним директивам по внедрению ИИ-инструментов, сотрудники Amazon придумывают задачи, завышают показатели использования и манипулируют метриками — это вскрывает порочную практику внедрения политики ИИ.

NVIDIA анонсирует NemoClaw с функциями безопасности OpenShell.
NVIDIA анонсировала NemoClaw на GTC, развивая OpenClaw для добавления корпоративной безопасности через OpenShell, который обеспечивает политики конфиденциальности и защитные механизмы для ИИ-агентов.