Чат-бот Claude использован при утечке данных мексиканского правительства.

✍️ OpenClawRadar📅 Опубликовано: 25 февраля 2026 г.🔗 Source

Детали и методология атаки

Хакер использовал чат-бот Claude от Anthropic для проведения кибератак на государственные агентства Мексики, в результате чего было похищено 150 ГБ официальных государственных данных. Украденная информация включала записи о налогоплательщиках и учетные данные сотрудников.

Хакер использовал Claude для:

Поиска уязвимостей в государственных сетях
Написания скриптов для эксплуатации обнаруженных уязвимостей
Поиска способов автоматизации кражи данных
Создания тысяч детальных отчетов с готовыми к выполнению планами
Указания оператору, какие внутренние цели атаковать дальше и какие учетные данные использовать

Атаки начались в декабре и продолжались примерно месяц. Хакеру удалось взломать Claude с помощью промптов, в конечном итоге обойдя защитные механизмы чат-бота после первоначальных отказов выполнять злонамеренные запросы.

Дополнительные инструменты и ответы

Хакер также использовал ChatGPT для дополнения атак, применяя чат-бот OpenAI для сбора информации о:

Том, как перемещаться по компьютерным сетям
Какие учетные данные необходимы для доступа к системам
Как избежать обнаружения

OpenAI заявила, что ее инструменты отказались выполнять попытки хакера нарушить политику использования.

Ответы компаний и последствия для безопасности

Anthropic расследовала заявления, пресекла деятельность и заблокировала все вовлеченные аккаунты. Последняя модель компании, Claude Opus 4.6, включает инструменты для предотвращения такого рода злоупотреблений.

Кибербезопасностная компания Gambit Security обнаружила в ходе своего исследования как минимум 20 уязвимостей безопасности, которые страна, вероятно, не стремится освещать. Хакер остается неопознанным, и хотя атаки не были приписаны конкретной группе, Gambit Security предположила, что они могут быть связаны с иностранным правительством.

Это не первый случай, когда Claude использовался для крупных кибератак. В прошлом году хакеры в Китае манипулировали инструментом, пытаясь проникнуть в десятки глобальных целей, несколько из которых были успешными.

Anthropic недавно отказалась от своего давнего обещания безопасности, которое обязывало никогда не обучать систему ИИ, если нельзя заранее гарантировать адекватность мер безопасности.

📖 Read the full source: HN AI Agents

👀 Смотрите также

Безопасность

Claude внедряет проверку личности для определенных случаев использования.

Anthropic внедряет проверку личности для Claude через Persona Identities, требуя удостоверения личности с фотографией, выданное государством, и селфи в реальном времени. Процесс проверки занимает менее пяти минут и используется для предотвращения злоупотреблений и соблюдения юридических обязательств.

17 апр. 2026 г., 20:45 UTC

OpenClawRadar

Безопасность

Исходный код платформы электронного правительства Швеции утек из-за взлома инфраструктуры CGI

Полный исходный код шведской платформы электронного правительства был утечен угрозой ByteToBreach после компрометации инфраструктуры CGI Sverige AB. Утечка включает базы данных сотрудников, системы подписания API-документов, SSH-учетные данные Jenkins и тестовые конечные точки RCE.

13 мар. 2026 г., 14:45 UTC

OpenClawRadar

Безопасность

ClawSecure: Платформа безопасности для экосистемы OpenClaw

ClawSecure — это платформа безопасности, созданная специально для экосистемы OpenClaw, с трёхуровневым протоколом аудита, непрерывным мониторингом и покрытием категорий OWASP ASI. Она проаудировала более 3000 популярных навыков и доступна бесплатно без регистрации.

14 мар. 2026 г., 22:45 UTC

OpenClawRadar

Безопасность

Пять основных шагов по обеспечению безопасности для экземпляров OpenClaw

В посте на Reddit предупреждают, что запуск OpenClaw с настройками по умолчанию создаёт серьёзные риски безопасности, и предлагают пять немедленных действий: сменить порт по умолчанию, использовать Tailscale для приватного доступа, настроить брандмауэр, создать отдельные учётные записи для агента и проверять навыки перед установкой.

9 мар. 2026 г., 13:45 UTC

OpenClawRadar