Корень доверия человека: ответственность автономных ИИ-агентов

Принцип Корня доверия человека решает основную проблему в цифровых системах: предположение, что за другим концом всегда находится человек. Поскольку автономные ИИ-агенты теперь выполняют задачи, которые раньше выполнялись только людьми, такие как управление транзакциями и подписание контрактов, возникает настоятельная необходимость в системах, которые могут связывать действия с подотчетными людьми.

Этот принцип вводит три основных столпа, необходимых для установления подотчетности в ИИ-системах:

Доказательство человечности: Обеспечивает четкую связь между действиями агента и реальным человеком.
Идентификатор устройства, основанный на оборудовании: Устанавливает целостность и подлинность устройства, гарантируя, что действия могут быть прослежены обратно к идентифицированному аппаратному источнику.
Подтверждение действий: Предоставляет проверяемые доказательства того, что действия, предпринятые ИИ-агентами, являются подлинными и разрешенными человеком-первопричиной.

Архитектура включает шестиэтапную цепочку доверия, связывающую человека-первопричину с криптографической квитанцией, обеспечивая полную прослеживаемость действий. Корень доверия человека не является продуктом или стандартом, а принципом публичного домена, разработанным для создания систем, которые криптографически управляют и проверяют подотчетность.

Реализаторам, таким как специалисты по безопасности, криптографы и юридические эксперты, рекомендуется развивать и уточнять этот принцип, который доступен бесплатно без патентных претензий или требований по атрибуции пользователей. Поскольку ИИ-агенты становятся все более распространенными, подобные принципы будут играть ключевую роль в ответах на вопросы подотчетности со стороны регулирующих органов.

📖 Читать полный источник: HN AI Agents

Человеческие корни доверия: Установление ответственности для автономных агентов ИИ

👀 Смотрите также

Петли угодничества ИИ: Уязвимость RLHF порождает зависимость и эхо-камеры

Фейковый сайт Claude распространяет вредоносное ПО PlugX через атаку с использованием подмены библиотек (sideloading).

AI Auditor zkao обнаружил критическую ошибку в библиотеке гостевой zkVM OpenVM

Frontier AI сломал соревнования CTF — GPT-5.5 решает безумные задачи Pwn с первой попытки