Infracost reduziert Claude-Token-Nutzung um 79% durch Neugestaltung der CLI für KI-Agenten

Infracost, ein CLI-Tool, das Cloud-Infrastrukturkosten aus Terraform, CloudFormation und CDK schätzt, hat seine Ausgabe für KI-Codierungsagenten wie Claude Code und Cursor neu gestaltet. Das Ergebnis: bis zu 79% weniger Ausgabetokens und 67% niedrigere API-Kosten im Vergleich zu einer reinen Claude-Baseline. Die Neugestaltung basiert auf zwei Techniken: Predicate Pushdown ins CLI und ein token-effizientes Ausgabeformat.
Benchmark-Details
- 16 Fragen über eine 3-Projekt-Terraform-Fixtur mit 1.171 Ressourcen
- Modell: Claude Opus, 5 Wiederholungen pro Frage
- Baseline: reines Claude mit Bash- und Read-Tools, ohne geladene Fähigkeiten
- Verglichen mit Infracost-Fähigkeit mit
--llm-Ausgabeflag
Wichtigste Ergebnisse
| Metrik | Reines Claude | Mit Infracost-Fähigkeit (--llm) | Änderung |
|---|---|---|---|
| Richtige Antworten | 5 / 11 (45%) | 11 / 11 (100%) | +6 |
| Gesamtkosten (USD) | 16,41 $ | 9,63 $ | -41% |
| Ausgabetokens | 207.017 | 81.697 | -61% |
| Echtzeit | 50 Min | 50 Min | gleich |
Ein Beispiel: Die Frage „zähle unterschiedliche Ressourcen, die gegen die Tagging-Richtlinie verstoßen, dedupliziert über Projekte hinweg" kostete mit reinem Claude 3,51 $ und erreichte das 25-Turn-Limit, ohne eine Antwort zu liefern. Mit dem neu gestalteten CLI kostete dieselbe Frage 0,25 $ und lieferte die richtige Antwort.
Technischer Ansatz
- Predicate Pushdown: Anstatt den Agenten JSON durch
jqzu pipen oder Python-Parser schreiben zu lassen, akzeptiert das CLI Filterflags (z. B.--tag-policy) und lagert die Berechnung an das Tool selbst aus. Dies reduziert die Anzahl der Turns und den Tokenverbrauch. - Token-effizientes Ausgabeformat: Das
--llm-Flag gibt ein kompaktes, agentenfreundliches Format zurück, anstatt ausführlicher, für Menschen lesbarer Tabellen oder vollständigem JSON. Dies allein trägt zu einem erheblichen Teil der Reduzierung bei.
Benchmark-Harness-Fallstricke
Infracost hat die Einrichtung seines Harness als Open Source veröffentlicht, um anderen zu helfen, Fehler zu vermeiden:
- Sandbox-
HOMEfür Baseline-Läufe, um versehentliches Laden von Fähigkeiten zu vermeiden TMPDIRauf ein projektspezifisches Verzeichnis setzen, um macOS-ACL-Probleme zu umgehen- Das Test-Binary zu
PATHhinzufügen, anstatt sich auf die Systeminstallation zu verlassen - 5+ Wiederholungen pro Zelle aufgrund von 20-30% Token-Varianz verwenden
- Zellen, die das Turn-Limit erreicht haben, erneut ausführen (
--rerun-failed) und neu bewerten, wenn sich der Verifizierer ändert (--rescore)
Wenn Sie ein CLI betreiben, das KI-Agenten als Subprozess aufrufen, sind dieselben beiden Maßnahmen – Predicate Pushdown und ein dediziertes Agenten-Ausgabeformat – wahrscheinlich anwendbar. Die Neugestaltung hat auch das für Menschen gedachte CLI verbessert, obwohl sich der Artikel auf den Agentenweg konzentriert.
📖 Vollständige Quelle lesen: HN AI Agents
👀 Siehe auch

NERF Open-Source-KI-Sicherheits-Engineering-Plattform tritt in die öffentliche Beta-Phase ein
NERF ist eine Open-Source-Plattform für KI-Sicherheitsentwicklung und ein autonomer Coding-Agent, der offensive, defensive und Datenschutz-Sicherheitstechniken über 117 Domänen abdeckt. Es bietet 9 automatisch erkannte Betriebsmodi, Unterstützung für 26 LLM-Anbieter und Compliance-Automatisierung für 39 Frameworks.

Mind Keg MCP: Persistenter Speicher für Claude Code und MCP-kompatible Agenten
Mind Keg MCP v0.1.1 ist ein Open-Source-MCP-Server, der persistente Speicher für Claude Code und andere MCP-kompatible Agenten bereitstellt. Er speichert Erkenntnisse lokal über SQLite und ruft sie per semantischer Suche ab, sodass KI-Codierungsassistenten Kontext zwischen Sitzungen behalten können.

Layerkit: KI-Bildeditor mit bearbeitbaren Ebenen – entwickelt mit Claude Code
Ein Entwickler hat Layerkit erstellt, einen browserbasierten KI-Bildeditor, der Szenen mit bearbeitbaren Ebenen generiert, um ständiges Neu-Eingeben von Prompts zu vermeiden. Das Tool verwendet eine mehrstufige KI-Pipeline, bei der ein LLM die Komposition plant, ein Bildmodell die Szene generiert und ein weiteres LLM das tatsächliche Bild analysiert, um lesbaren Text zu platzieren.

Claude Code-Fähigkeit erstellt App Store-Screenshots mit Gemini AI
Eine neue Claude Code-Fähigkeit namens /aso-cosmicmeta-ss erstellt App Store- und Google Play-Screenshots über einen 6-Phasen-Workflow, der Codebasen analysiert und Gemini AI zur Verbesserung nutzt. Die Fähigkeit enthält eine Freigabestufe, um Layoutprobleme zu erkennen, bevor API-Guthaben verwendet werden.