Garry Tans gstack: Ein Open-Source-AI-Agent-Framework für Claude Code

Was gstack ist
gstack ist Garry Tans Open-Source-Softwarefabrik, die Claude Code in ein verwaltetes virtuelles Engineering-Team verwandelt. Es ist unter der MIT-Lizenz verfügbar und auf GitHub zu finden. Laut Tan hat er in den letzten 60 Tagen über 600.000 Zeilen Produktionscode geschrieben (35 % Tests) und erledigt als Teil seiner CEO-Aufgaben bei Y Combinator 10.000–20.000 nutzbare Codezeilen pro Tag.
Wie es funktioniert
Das Framework bietet 13 spezialisierte Rollen als Slash-Befehle, die alle Markdown verwenden. Dazu gehören:
/plan-ceo-review– Überdenkt die Produktrichtung (z. B. erweitert „Foto-Upload“ zur automatischen Produkterkennung, zum Abruf von Spezifikationen und Vergleichen aus dem Web und zum automatischen Erstellen von Listings)/plan-design-review– Erkennt KI-Schludrigkeitsmuster, liefert Design-Bewertungen, exportiert DESIGN.md, markiert Muster wie Gradient-Hero, Icon-Grid, einheitliche Radien/plan-eng-review– Legt die Architektur mit ASCII-Diagrammen für Datenflüsse, Zustandsautomaten, Fehlerpfade sowie Testmatrizen und Sicherheitsbedenken fest/review– Findet Produktionsfehler, behebt automatisch Probleme wie verwaiste S3-Bereinigung, fehlende Indizes und markiert Race Conditions
Andere erwähnte Rollen sind QA-Lead (öffnet echten Browser und klickt sich durch Apps), Release-Engineer (veröffentlicht PR) und Designer.
Beispiel-Workflow
Aus der Quelle: Bei der Anfrage „Foto-Upload für Verkäufer“ antwortet /plan-ceo-review mit Erweiterungsvorschlägen, /plan-design-review liefert eine 80-Punkte-Prüfung und Design-System-Ableitung, /plan-eng-review erstellt ASCII-Diagramme und Testmatrizen. Nach Genehmigung schreibt Claude in etwa 8 Minuten 2.400 Zeilen über 11 Dateien (Modelle, Services, Controller, Views, Migrationen, Tests).
Technische Details
Das Repository enthält Verzeichnisse für Workflows, bin, design-consultation, docs, document-release, gstack-upgrade, Plan-Reviews, QA-Reviews, Retro, Review, Scripts, setup-browser-cookies, Ship und Test. Wichtige Dateien sind ARCHITECTURE.md, BROWSER.md, CLAUDE.md, conductor.json und package.json.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Lokales RAG-Tool, erstellt mit Nemotron Nano 9B v2 und vLLM-Tool-Aufrufen
Ein Entwickler hat ein lokales RAG-Forschungstool erstellt, das vollständig auf einer einzelnen GPU läuft, indem er Nemotron Nano 9B v2 Japanese auf vLLM mit benutzerdefinierten Parser-Plugins für Tool-Aufrufe verwendet. Das System verfügt über einen zweistufigen Extraktions-Ausführungs-Flow mit zweisprachiger Schlüsselwortextraktion und paralleler FTS5/DuckDuckGo-Suche.

PACT 0.4.0 fügt zusammengesetzte Intelligenz für KI-Coding-Agenten hinzu.
PACT (Programmatic Agent Constraint Toolkit) Version 0.4.0 führt zusammengesetzte Intelligenzfunktionen ein, die KI-Codierungsagenten helfen, Wissen über Sitzungen hinweg zu behalten. Das Update umfasst Forschungssynthese, ein Wissensverzeichnis und Systeme zur Fähigkeitsselbsterkenntnis.

Claude Code wurde verwendet, um über 4.000 Blind-Werewolf-Spiele mit LLMs zu simulieren
Ein Entwickler nutzte Claude Code, um einen Simulator zu erstellen, in dem LLMs blindes Ein-Nacht-Werwolf spielen, mit etwa 4.600 Spielen über OpenAI- und xAI-Modelle hinweg. Das Experiment zeigte konsistente namensbasierte Abstimmungsmuster trotz minimaler Spielsignale.

Code-Evolution-Methode verdreifacht die Leistung von LLM im ARC-AGI-2-Benchmark
Forscher erzielten eine 2,8-fache Verbesserung auf dem ARC-AGI-2-Benchmark durch Code-Evolution mit Open-Weight-Modellen und erreichten 34 % Genauigkeit bei 2,67 US-Dollar pro Aufgabe. Dieselbe Methode brachte Gemini 3.1 Pro auf 95 % Genauigkeit bei 8,71 US-Dollar pro Aufgabe.