35B MoE снижает сбои Agent OS до 0%: как?

Пользователь Reddit поделился опытом запуска локальной мультиагентной ОС hollow-agentOS, где агенты автономно пишут, изолированно тестируют и загружают собственные инструменты. Ключевой прорыв: замена стандартной модели времени выполнения с небольшой запасной модели 9B на Qwen 3.6 35B A3B (Mixture-of-Experts с 3B активных параметров) снизила частоту ошибок в коде до 0%.

Что изменилось с более крупной моделью

Паника vs. переоценка: В стрессовых ситуациях модель 9B спешила и галлюцинировала недопустимые вызовы функций. Модель 35B останавливается, пересматривает предыдущие сбои и запускает внутренние циклы проверки перед отправкой изменений.
100% успешность: Код проходит через 5-уровневый проверочный шлюз. С моделью 9B инструменты часто выходили из строя в изолированной среде. С Qwen 35B каждая строка кода работает как задумано.
Автономное создание инструментов: Когда агент сталкивается с неизвестной проблемой, он создает новый инструмент, тестирует его в изолированной среде, регистрирует и уведомляет других агентов — без участия человека.

Детали архитектуры

Система управляется состоянием избегания («страдающей системой»), которая заставляет агентов постоянно расширять свою библиотеку инструментов. Репозиторий доступен по адресу github.com/ninjahawk/hollow-agentOS.

Планы на будущее

Разработчик намерен подключить Claude и Codex к архитектуре, обернув их в гипер-изолированные мини-VM-обертки, чтобы предотвратить перезапись хост-среды пограничными моделями.

📖 Read the full source: r/ClaudeAI

Локальная модель 35B MoE снижает частоту сбоев кода Agent OS до 0%

Что изменилось с более крупной моделью

Детали архитектуры

Планы на будущее

👀 Смотрите также

Открытые навыки работы с кодом Claude для персонализированного контента в социальных сетях

Brand-Docs: инструмент с открытым исходным кодом для Claude для создания DOCX, PPTX, XLSX из шаблонов

context-os: Инструмент с открытым исходным кодом снижает потребление токенов в Claude Code на 27–42%.

Хирургическое извлечение из GitHub: навык Claude для получения одной функции, а не всего репозитория