Hollow AgentOS: Lokal betreiben von Claude-ähnlichen Agenten auf RTX 5070 mit Qwen 3.5 9B

Der Entwickler /u/TheOnlyVibemaster hat Hollow AgentOS veröffentlicht, ein selbstmodifizierendes Agentensystem, das lokal auf einer RTX 5070 (oder jedem CPU-Laptop, wenn auch langsamer) läuft und behauptet, den Claude-API-Verbrauch zu halbieren. Das System läuft rund um die Uhr und überprüft im Leerlauf seine eigenen Quelldateien, schlägt Verbesserungen vor und setzt diese nach einer 2/3-Mehrheitsabstimmung aller Agenten um.
So funktioniert es
Die Kernidee: Durch eine Schleife aus iterativem Testen und Selbstverbesserung stellte der Autor fest, dass Qwen 3.5 9B bei ausreichender Laufzeit für viele Aufgaben genauso nützlich ist wie Claude Code. Der Agent schlägt Code vor, schreibt ihn, testet ihn, überprüft Ergebnisse, bearbeitet und wiederholt dies unbegrenzt. Der Autor sagt: „Es wird zu einem Zeitproblem, nicht zu einem Modellproblem.“
Hauptfunktionen
- Selbstmodifikation ohne menschlichen Input: Im Leerlauf überprüfen die Agenten die eigenen Systemdateien, schlagen Verbesserungen vor und setzen Änderungen in einer Sandbox-Umgebung nach einer 2/3-Mehrheitsabstimmung autonom um.
- Echte Offline-Entwicklung: Der Autor sagt: „Claude denkt, und dann kopiere ich im Grunde nur Claudes Anweisungen für die Agenten. Komme in 6 Stunden zurück und es ist kostenlos auf lokaler Hardware erledigt.“
- Hardware-unabhängig: Demonstriert auf einem RTX 5070 Gaming-PC, aber auf jedem Laptop mit CPU lauffähig (langsamer).
Zwei Kernprobleme gelöst
Der Autor listet zwei spezifische Probleme auf, die Hollow AgentOS adressiert: A) Ermöglicht „echtes Entwickeln ohne Entwickeln“ – Aufgaben auslagern, die über Zeit gelöst werden können; B) Erlaubt dem System, „sich selbst über die Zeit wirklich weiterzuentwickeln, zu lernen und anzupassen ohne menschliche Interaktion“, es sei denn, der Benutzer greift ein.
Repository und Community
Das Projekt ist auf GitHub unter github.com/ninjahawk/hollow-agentOS verfügbar und hatte zum Zeitpunkt der Veröffentlichung 66 Sterne. Der Autor dankt Hunderten von Testern und ermutigt zu Feedback, Kritik oder Erfolgsgeschichten.
Für wen es geeignet ist: Entwickler, die Claude-API-Kosten senken möchten, indem sie Qwen 3.5 9B-Agenten lokal für Aufgaben ausführen, die längere Bearbeitungszeiten gegen kostenlose Rechenleistung eintauschen können.
📖 Vollständige Quelle lesen: r/ClaudeAI
👀 Siehe auch

Claudlytics: Selbst gehostetes Dashboard zur Verfolgung von Claude-Code-Token-Nutzung und Kosten
Claudlytics ist ein Node.js-Webserver, der lokale .jsonl-Sitzungsdateien von Claude Code liest, um die Token-Nutzung und Kosten in Echtzeit zu verfolgen. Er läuft lokal auf 127.0.0.1 und kann über einen SSH-Tunnel für Remote-Server zugänglich gemacht werden.
DuckDBs Quack Protocol ermöglicht Client-Server mit mehreren gleichzeitigen Schreibern
DuckDB führt das Quack Remote-Protokoll ein, das zwei DuckDB-Instanzen die Kommunikation als Client und Server ermöglicht, gleichzeitige Schreiber unterstützt und HTTP für den Transport nutzt.

Modulus: Repository-übergreifende Wissensorchestrierung für KI-Codierungsagenten
Modulus ist eine Desktop-Anwendung, die mehrere KI-Codierungsagenten mit gemeinsamem Projektgedächtnis über Repositorys hinweg ausführt. Sie löst Kontextprobleme zwischen Repositorys, indem sie Agenten ermöglicht, Abhängigkeiten zwischen verschiedenen Codebasen zu verstehen, ohne manuelle Erklärungen.

Open-Source-Tool ermöglicht es Claude, Unreal Engine direkt zu steuern
soft-ue-cli ist ein Python-Tool mit einem C++-Plugin, das Claude Code und Claude Desktop ermöglicht, Befehle in Unreal Engine ohne Editor-Interaktion auszuführen, mit über 60 Operationen inklusive Blueprint-Bearbeitung, Actor-Erstellung und Performance-Profiling.