Qwen 3.6 35B MoEでAgent OS障害率0％に低減

あるRedditユーザーが、hollow-agentOSというローカルのマルチエージェントOSを実行した経験を共有しました。このOSでは、エージェントが自律的にツールを作成し、サンドボックスでテストし、ホットロードします。重要な進展は、デフォルトのランタイムモデルを小さな9BのフォールバックからQwen 3.6 35B A3B（アクティブパラメータ3BのMixture-of-Experts）にアップグレードしたことで、コードの不具合率が0%になったことです。

大規模モデルによる変化

パニック vs 再評価: ストレス下では、9Bモデルは焦って無効な関数呼び出しを幻覚しました。35Bモデルは一時停止し、以前の失敗を再評価し、変更を送信する前に内部検証ループを実行します。
100%の成功率: コードは5層の検証ゲートを通過します。9Bモデルでは、ツールが頻繁にサンドボックス内で死んでいました。Qwen 35Bでは、すべてのコード行が意図した通りに動作します。
自律的なツール作成: エージェントが未知の問題に遭遇すると、新しいツールを構築し、サンドボックスでテストし、登録し、他のエージェントに通知します。人間の介入はありません。