Локальная модель 35B MoE снижает частоту сбоев кода Agent OS до 0%

Пользователь Reddit поделился опытом запуска локальной мультиагентной ОС hollow-agentOS, где агенты автономно пишут, изолированно тестируют и загружают собственные инструменты. Ключевой прорыв: замена стандартной модели времени выполнения с небольшой запасной модели 9B на Qwen 3.6 35B A3B (Mixture-of-Experts с 3B активных параметров) снизила частоту ошибок в коде до 0%.
Что изменилось с более крупной моделью
- Паника vs. переоценка: В стрессовых ситуациях модель 9B спешила и галлюцинировала недопустимые вызовы функций. Модель 35B останавливается, пересматривает предыдущие сбои и запускает внутренние циклы проверки перед отправкой изменений.
- 100% успешность: Код проходит через 5-уровневый проверочный шлюз. С моделью 9B инструменты часто выходили из строя в изолированной среде. С Qwen 35B каждая строка кода работает как задумано.
- Автономное создание инструментов: Когда агент сталкивается с неизвестной проблемой, он создает новый инструмент, тестирует его в изолированной среде, регистрирует и уведомляет других агентов — без участия человека.
Детали архитектуры
Система управляется состоянием избегания («страдающей системой»), которая заставляет агентов постоянно расширять свою библиотеку инструментов. Репозиторий доступен по адресу github.com/ninjahawk/hollow-agentOS.
Планы на будущее
Разработчик намерен подключить Claude и Codex к архитектуре, обернув их в гипер-изолированные мини-VM-обертки, чтобы предотвратить перезапись хост-среды пограничными моделями.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

mycrab.space представляет SKILL.md и Prompt Autocomposer для стандартизированного развертывания приложений
mycrab.space выпустил SKILL.md — Markdown-шаблон для определения зависимостей и конфигурации приложений, а также Prompt Autocomposer, который генерирует готовые к использованию команды развертывания из этих файлов. Система позволяет выполнять развертывание приложений, таких как VS Code в браузере, персональные музыкальные облака и интерфейсы ИИ-агентов, без какой-либо конфигурации.
Хирургическое извлечение из GitHub: навык Claude для получения одной функции, а не всего репозитория
Новый навык Claude с открытым исходным кодом под названием surgical-github-extraction не позволяет Claude Code клонировать целые репозитории, когда вам нужна всего одна функция или шаблон. Он читает README, извлекает 1–3 исходных файла и выделяет наименьший полезный модуль с комментарием о происхождении.

Открытые инструменты Claude Code для автоматизированного охоты за баунти-багами
Три репозитория с открытым исходным кодом автоматизируют процесс поиска уязвимостей с помощью Claude Code. Инструменты выполняют разведку, сканирование на уязвимости web2/web3 и генерируют готовые к отправке отчёты.

Динамическая строка состояния для Claude Code показывает обновления в реальном времени
Разработчик улучшил свою строку состояния Claude Code, превратив её из статического текста в динамическое отображение с обновлениями в реальном времени, показывающими, над чем работает Claude. Конфигурация доступна в виде GitHub gist.