Modelo MoE 35B Local Reduce la Tasa de Fallos del Código de Agent OS al 0%

Un usuario de Reddit compartió su experiencia ejecutando un sistema operativo multiagente local llamado hollow-agentOS, donde los agentes escriben, aíslan y cargan en caliente sus propias herramientas de forma autónoma. El avance clave: actualizar el modelo de runtime predeterminado de un pequeño modelo de 9B a Qwen 3.6 35B A3B (Mixture-of-Experts con 3B parámetros activos) redujo la tasa de fallos de código al 0%.
Qué cambió con el modelo más grande
- Pánico vs. reevaluación: Bajo estrés, el modelo de 9B se apresuraba y alucinaba llamadas a funciones inválidas. El modelo de 35B se detiene, reevalúa fallos anteriores y ejecuta bucles de verificación internos antes de enviar cambios.
- Tasa de éxito del 100%: El código pasa por una puerta de validación de 5 capas. Con el modelo de 9B, las herramientas morían con frecuencia en el entorno aislado. Con Qwen 35B, cada línea de código funciona como se espera.
- Creación autónoma de herramientas: Cuando un agente encuentra un problema desconocido, construye una nueva herramienta, la prueba en un entorno aislado, la registra y notifica a otros agentes, sin intervención humana.
Detalles de la arquitectura
El sistema está impulsado por un estado aversivo (un "sistema de sufrimiento") que empuja a los agentes a expandir continuamente su biblioteca de herramientas. El repositorio está disponible en github.com/ninjahawk/hollow-agentOS.
Planes futuros
El desarrollador planea conectar Claude y Codex a la arquitectura, envolviéndolos en envoltorios de mini-VM hiperaislados para evitar que los modelos frontera sobrescriban el entorno anfitrión.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Zeude: Panel de Monitoreo Autohospedado para Claude Code y OpenAI Codex
Zeude es un panel de control autohospedado que rastrea el uso de Claude Code y OpenAI Codex, proporcionando desgloses de tokens y costos por solicitud, tablas de clasificación semanales y gestión de habilidades del equipo. La versión 1.0.0 agrega soporte para Windows, integración con Codex y la opción de excluir habilidades por usuario.

Problemas del Flujo de Trabajo Multi-Agente OpenClaw: Bloqueos, Pérdida de Contexto e Ineficiencia de Tokens
Un desarrollador reporta que los flujos de trabajo multiagente de OpenClaw frecuentemente se estancan con agentes colgados, experimentan fugas de contexto a pesar de la documentación personalizada y consumen tokens excesivos sin generar resultados. La configuración utilizó modelos Gemini 3 Pro/Codex con un orquestador COO y agentes de tareas especializados.

VoidLLM: Proxy de Conocimiento Cero para Ollama y vLLM con Control de Acceso por Equipo
VoidLLM es un proxy que se sitúa entre las aplicaciones y los servidores locales de LLM como Ollama y vLLM, añadiendo control de acceso por organización/equipo, gestión de claves API, seguimiento de uso y limitación de tasa sin ver los prompts. Tiene una sobrecarga de proxy de <2ms y funciona con SDKs compatibles con OpenAI.

Jan Agrega Instalación de OpenClaw con Un Solo Clic con Integración del Modelo Base Jan-v3
Jan ahora admite la instalación con un solo clic de OpenClaw con integración directa al modelo Jan-v3-base, manteniendo todas las operaciones locales y privadas en tu computadora.