Hollow AgentOS réduit l'utilisation de tokens de code Claude de 68,5 % grâce à un OS natif JSON pour les agents IA.

Hollow AgentOS est un système d'exploitation natif JSON conçu spécifiquement pour les agents IA qui réduit l'utilisation de tokens dans Claude Code de 68,5 %. L'outil résout les inefficacités de l'infrastructure actuelle des agents IA, qui est conçue pour les humains plutôt que pour les agents.
Fonctionnement
Le problème central que Hollow AgentOS résout est le gaspillage dans les flux de travail traditionnels des agents. Selon la source, chaque vérification d'état exécute 9 commandes shell, et chaque démarrage à froid redécouvre le contexte depuis le début. Le système d'exploitation natif JSON pour agents élimine cette surcharge en fournissant des interfaces natives pour les agents.
Résultats des benchmarks
Les benchmarks sur 5 scénarios réels montrent :
- Recherche sémantique vs grep + cat : 91 % de tokens en moins
- Reprise d'agent vs analyse de logs à froid : 83 % de tokens en moins
- Interrogation d'état vs commandes shell : 57 % de tokens en moins
- Réduction globale : 68,5 %
Le benchmark est entièrement reproductible en utilisant python3 tools/bench_compare.py.
Implémentation technique
Hollow AgentOS se connecte à Claude Code via MCP (Model Context Protocol) et exécute des inférences locales via Ollama. Le projet est sous licence MIT et disponible sur GitHub.
Le créateur recherche des retours de personnes qui exécutent réellement des flux de travail d'agents.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Outil PRECC Réduit les Coûts de l'API Claude Code grâce à la Compression Pré-Appel d'Outil
Un développeur a créé PRECC, un outil open source qui intercepte les appels de l'outil Claude Code et compresse les charges utiles en utilisant RTK (Redundancy-aware Token Kompression), réduisant les jetons d'entrée de 40 à 66 % sans impact de latence perceptible.

Le développeur d'OpenClaw crée le plugin de mémoire cognitive Kumiho pour une collaboration persistante entre agents.
Un développeur a créé Kumiho, un système de mémoire cognitive IA soutenu par un graphe de connaissances, pour remédier au manque de mémoire d'OpenClaw entre les sessions. Le plugin openclaw-kumiho s'intègre aux conversations pour rappeler le contexte, capturer des résumés structurés et maintenir des productions créatives versionnées.

Transformer le Code Claude en une Équipe d'Ingénierie Autonome
La configuration ~/.claude/ transforme Claude Code en un système de construction autonome, générant et testant du code de manière autonome.

GLM-5-Turbo présente un faible taux d'erreur d'appel d'outils lors des tests utilisateurs.
Le modèle z-ai/glm-5-turbo présente un taux d'erreur moyen de 0,57 % lors des appels d'outils en test, ce qui est nettement inférieur au taux d'environ 3 % du GLM-5. Un utilisateur a rapporté l'avoir utilisé avec succès avec un outil CLI pour écrire un roman fantastique de 97 000 mots avec très peu de problèmes.