Garry Tans gstack: Ein Open-Source-AI-Agent-Framework für Claude Code

✍️ OpenClawRadar📅 Veröffentlicht: 17. März 2026🔗 Source
Garry Tans gstack: Ein Open-Source-AI-Agent-Framework für Claude Code
Ad

Was gstack ist

gstack ist Garry Tans Open-Source-Softwarefabrik, die Claude Code in ein verwaltetes virtuelles Engineering-Team verwandelt. Es ist unter der MIT-Lizenz verfügbar und auf GitHub zu finden. Laut Tan hat er in den letzten 60 Tagen über 600.000 Zeilen Produktionscode geschrieben (35 % Tests) und erledigt als Teil seiner CEO-Aufgaben bei Y Combinator 10.000–20.000 nutzbare Codezeilen pro Tag.

Wie es funktioniert

Das Framework bietet 13 spezialisierte Rollen als Slash-Befehle, die alle Markdown verwenden. Dazu gehören:

  • /plan-ceo-review – Überdenkt die Produktrichtung (z. B. erweitert „Foto-Upload“ zur automatischen Produkterkennung, zum Abruf von Spezifikationen und Vergleichen aus dem Web und zum automatischen Erstellen von Listings)
  • /plan-design-review – Erkennt KI-Schludrigkeitsmuster, liefert Design-Bewertungen, exportiert DESIGN.md, markiert Muster wie Gradient-Hero, Icon-Grid, einheitliche Radien
  • /plan-eng-review – Legt die Architektur mit ASCII-Diagrammen für Datenflüsse, Zustandsautomaten, Fehlerpfade sowie Testmatrizen und Sicherheitsbedenken fest
  • /review – Findet Produktionsfehler, behebt automatisch Probleme wie verwaiste S3-Bereinigung, fehlende Indizes und markiert Race Conditions

Andere erwähnte Rollen sind QA-Lead (öffnet echten Browser und klickt sich durch Apps), Release-Engineer (veröffentlicht PR) und Designer.

Ad

Beispiel-Workflow

Aus der Quelle: Bei der Anfrage „Foto-Upload für Verkäufer“ antwortet /plan-ceo-review mit Erweiterungsvorschlägen, /plan-design-review liefert eine 80-Punkte-Prüfung und Design-System-Ableitung, /plan-eng-review erstellt ASCII-Diagramme und Testmatrizen. Nach Genehmigung schreibt Claude in etwa 8 Minuten 2.400 Zeilen über 11 Dateien (Modelle, Services, Controller, Views, Migrationen, Tests).

Technische Details

Das Repository enthält Verzeichnisse für Workflows, bin, design-consultation, docs, document-release, gstack-upgrade, Plan-Reviews, QA-Reviews, Retro, Review, Scripts, setup-browser-cookies, Ship und Test. Wichtige Dateien sind ARCHITECTURE.md, BROWSER.md, CLAUDE.md, conductor.json und package.json.

📖 Read the full source: HN AI Agents

Ad

👀 Siehe auch

Lokales RAG-Tool, erstellt mit Nemotron Nano 9B v2 und vLLM-Tool-Aufrufen
Werkzeuge

Lokales RAG-Tool, erstellt mit Nemotron Nano 9B v2 und vLLM-Tool-Aufrufen

Ein Entwickler hat ein lokales RAG-Forschungstool erstellt, das vollständig auf einer einzelnen GPU läuft, indem er Nemotron Nano 9B v2 Japanese auf vLLM mit benutzerdefinierten Parser-Plugins für Tool-Aufrufe verwendet. Das System verfügt über einen zweistufigen Extraktions-Ausführungs-Flow mit zweisprachiger Schlüsselwortextraktion und paralleler FTS5/DuckDuckGo-Suche.

OpenClawRadar
PACT 0.4.0 fügt zusammengesetzte Intelligenz für KI-Coding-Agenten hinzu.
Werkzeuge

PACT 0.4.0 fügt zusammengesetzte Intelligenz für KI-Coding-Agenten hinzu.

PACT (Programmatic Agent Constraint Toolkit) Version 0.4.0 führt zusammengesetzte Intelligenzfunktionen ein, die KI-Codierungsagenten helfen, Wissen über Sitzungen hinweg zu behalten. Das Update umfasst Forschungssynthese, ein Wissensverzeichnis und Systeme zur Fähigkeitsselbsterkenntnis.

OpenClawRadar
Claude Code wurde verwendet, um über 4.000 Blind-Werewolf-Spiele mit LLMs zu simulieren
Werkzeuge

Claude Code wurde verwendet, um über 4.000 Blind-Werewolf-Spiele mit LLMs zu simulieren

Ein Entwickler nutzte Claude Code, um einen Simulator zu erstellen, in dem LLMs blindes Ein-Nacht-Werwolf spielen, mit etwa 4.600 Spielen über OpenAI- und xAI-Modelle hinweg. Das Experiment zeigte konsistente namensbasierte Abstimmungsmuster trotz minimaler Spielsignale.

OpenClawRadar
Code-Evolution-Methode verdreifacht die Leistung von LLM im ARC-AGI-2-Benchmark
Werkzeuge

Code-Evolution-Methode verdreifacht die Leistung von LLM im ARC-AGI-2-Benchmark

Forscher erzielten eine 2,8-fache Verbesserung auf dem ARC-AGI-2-Benchmark durch Code-Evolution mit Open-Weight-Modellen und erreichten 34 % Genauigkeit bei 2,67 US-Dollar pro Aufgabe. Dieselbe Methode brachte Gemini 3.1 Pro auf 95 % Genauigkeit bei 8,71 US-Dollar pro Aufgabe.

OpenClawRadar