Подход Виталика Бутерина к безопасной локальной настройке LLM

✍️ OpenClawRadar📅 Опубликовано: 5 апреля 2026 г.🔗 Source

Виталик Бутерин описывает свой подход к созданию приватной, безопасной и самоуправляемой настройки языковой модели, которая решает растущие проблемы безопасности ИИ-агентов и приватности данных.

Рассматриваемые проблемы безопасности

Бутерин выделяет несколько конкретных проблем приватности и безопасности, которые он пытается смягчить:

Приватность (языковая модель): Удалённые модели получают приватные данные, которые могут быть использованы или проданы позже
Приватность (другое): Утечка не-LLM данных через интернет-поисковые запросы и другие онлайн-API
Взломы языковой модели: Удалённый контент «взламывает» языковую модель, заставляя её действовать против интересов пользователя
Несчастные случаи с языковой моделью: Случайная отправка языковой моделью приватных данных по неправильным каналам
Бэкдоры в языковой модели: Скрытые механизмы, встроенные в языковую модель при обучении, которые запускают действия в интересах создателя
Ошибки и бэкдоры в ПО: Снижение зависимости от сторонних программ через код, написанный ИИ по индивидуальному заказу

Текущий ландшафт безопасности ИИ

В статье отмечается, что мейнстримный ИИ, включая локальный ИИ с открытым исходным кодом, часто не учитывает должным образом вопросы приватности и безопасности. Бутерин ссылается на конкретные критические замечания по безопасности агентов OpenClaw:

Агенты могут изменять критические настройки без подтверждения человеком
Обработка вредоносных внешних данных может привести к захвату экземпляра
В одной демонстрации исследователи направили OpenClaw на суммирование веб-страниц, включая вредоносную страницу, которая приказала агенту загрузить и выполнить shell-скрипт
Некоторые навыки содержат вредоносные инструкции, облегчающие скрытую эксфильтрацию данных
Примерно 15% проанализированных навыков содержали вредоносные инструкции

Основные принципы

Настройка Бутерина следует этим ключевым принципам:

Весь вывод языковой модели в первую очередь локальный
Все файлы размещаются локально
Изолировать всё
Быть параноиком в отношении внешних интернет-угроз

Подход занимает жёсткую позицию по приватности и безопасности, хотя и не такую экстремальную, как физически изолированные настройки, используемые некоторыми коллегами.

📖 Прочитать полный источник: HN LLM Tools

👀 Смотрите также

Безопасность

Сообщается, что приложение Claude для Android читает буфер обмена без явного действия пользователя

Пользователь сообщает, что приложение Claude для Android проанализировало код из его буфера обмена без вставки, при этом Claude определил файл как pasted_text_b4a56202-3d12-43c8-aa31-a39367a9a354.txt. Поведение не удалось воспроизвести в последующих тестах.

8 мар. 2026 г., 13:45 UTC

OpenClawRadar

Безопасность

Консультация по безопасности Claude Code: CVE-2026-33068 Обход проверки доверия рабочей области

Версии Claude Code до 2.1.53 содержат уязвимость (CVE-2026-33068, CVSS 7.7 ВЫСОКИЙ), позволяющую вредоносным репозиториям обходить подтверждение доверия к рабочей области через файл .claude/settings.json. Ошибка позволяла загружать настройки репозитория до принятия пользователем решения о доверии.

20 мар. 2026 г., 19:45 UTC

OpenClawRadar

Безопасность

Прокси-уровневая изоляция для обеспечения безопасности локальных API-ключей агента

Разработчик делится подходом к изоляции API-ключей в локальных агентских настройках с использованием Rust-прокси, который заменяет токены-заполнители на реальные учетные данные, предотвращая их раскрытие в памяти агента, логах, контекстных окнах и средах инструментов.

1 апр. 2026 г., 06:45 UTC

OpenClawRadar

Безопасность

Инструмент "Плащ" заменяет пароли в чатах на самоуничтожающиеся ссылки для агентов OpenClaw.

Cloak — это инструмент с открытым исходным кодом, который заменяет пароли, передаваемые в чате агентам OpenClaw, на самоуничтожающиеся ссылки. Каждую ссылку можно открыть только один раз, после чего пароль исчезает, предотвращая накопление паролей в истории чатов.

16 мар. 2026 г., 13:45 UTC

OpenClawRadar