Claude внедряет проверку личности для определенных случаев использования.

Требования к проверке личности для Claude
Anthropic внедряет проверку личности для Claude, чтобы предотвратить злоупотребления, обеспечить соблюдение политик использования и выполнить юридические обязательства. Проверка внедряется для конкретных случаев использования и может появляться во время плановых проверок целостности платформы или мер безопасности.
Детали процесса проверки
Для завершения проверки личности пользователям необходимо:
- Действительное удостоверение личности с фотографией, выданное государством (физический документ, не цифровой)
- Телефон или компьютер с камерой для селфи в реальном времени
- Менее пяти минут на процесс
Принимаемые типы удостоверений включают паспорта, водительские права, удостоверения личности штата/провинции и национальные удостоверения личности из большинства стран. Удостоверения должны быть оригинальными, физическими, выданными государством, четко читаемыми, неповрежденными и содержать фотографию.
Не принимаются: фотокопии, скриншоты, сканы, фотографии фотографий, цифровые/мобильные удостоверения, негосударственные удостоверения (студенческие билеты, служебные пропуска) или временные бумажные удостоверения.
Защита данных и конфиденциальность
Anthropic использует Persona Identities в качестве партнера по проверке. Persona собирает и хранит данные удостоверения и селфи, а не Anthropic. Anthropic может получать доступ к записям проверки через платформу Persona при необходимости (например, для апелляций), но не копирует и не хранит сами изображения.
Persona по контракту ограничена использованием данных только для проверки, предотвращения мошенничества и поддержки. Все данные шифруются при передаче и хранении. Данные проверки не используются для обучения моделей, не передаются третьим лицам в маркетинговых целях и остаются между пользователем, Persona и Anthropic, за исключением случаев, предусмотренных законом.
Неудачи при проверке и проблемы с аккаунтом
Если проверка не удалась из-за размытых фотографий, нечитаемых документов, просроченных удостоверений или технических проблем, пользователи могут повторить попытку в рамках процесса проверки. Большинство неудач решается путем повторной съемки фотографий при лучшем освещении или использования другого удостоверения личности с фотографией, выданного государством.
Аккаунты могут быть заблокированы после проверки по причинам, включая неоднократные нарушения Политики использования, создание аккаунта из неподдерживаемых местоположений, нарушение Условий обслуживания или использование лицами младше 18 лет. Пользователи могут обжаловать блокировки через форму для расследования командой Safeguards.
📖 Read the full source: HN AI Agents
👀 Смотрите также

McpVanguard: Открытый прокси-сервер безопасности для ИИ-агентов на основе MCP
McpVanguard — это трёхуровневый прокси-сервер безопасности и межсетевой экран, который располагается между ИИ-агентами и инструментами MCP, обеспечивая защиту от инъекций в промпты, обхода путей и других атак с задержкой около 16 мс.

Критическая уязвимость удаленного выполнения кода (RCE) в библиотеке protobuf.js
Критическая уязвимость удаленного выполнения кода в protobuf.js версий 8.0.0/7.5.4 и ниже позволяет выполнять JavaScript-код через вредоносные схемы. Исправления доступны в версиях 8.0.1 и 7.5.5.

Защита разделителями повышает устойчивость Gemma 4 к инъекциям промптов с 21% до 100% в тестовом бенчмарке из 6100+ примеров
Бенчмарк протестировал 15 моделей на 7 типах атак (6100+ тестов), используя случайные разделители вокруг ненадежного контента. Gemma 4 E4B улучшила показатель защиты с 21,6% до 100% при использовании разделителя + строгого промпта.

Исследование: Невидимые символы Unicode могут перехватывать управление агентами LLM через доступ к инструментам
Исследование проверило, следуют ли большие языковые модели (LLM) инструкциям, скрытым в невидимых символах Юникода, встроенных в обычный текст, используя две схемы кодирования для пяти моделей и 8 308 оцененных ответов. Ключевой вывод: доступ к инструментам повышает выполнение инструкций с менее 17% до 98-100%, при этом модели пишут скрипты на Python для декодирования скрытых символов.