VTCode: Ein Rust TUI-Coding-Agent, der Kontext durch AST-Level-Chunking aggressiv kürzt

VTCode ist ein Open-Source Rust TUI Coding Agent, der einen anderen Ansatz für das Kontextmanagement verfolgt: Anstatt das gesamte Verzeichnis in jeden Prompt zu übernehmen, kürzt er den Kontext mithilfe von AST-Level-Chunking aggressiv. Entwickelt mit Fokus auf Token-Effizienz und Sicherheit, nutzt es ripgrep und ast-grep, um nur strukturell relevante Code-Chunks zu extrahieren und die Prompt-Größe bei Refaktorierungsaufgaben drastisch zu reduzieren.
Kernfunktionen
- AST-Level-Kontextextraktion: Nutzt ripgrep + ast-grep, um nur relevante Code-Chunks an das Modell zu senden und so den Tokenverbrauch zu senken.
- Explizite Token-Budget-Überwachung: Der Agent überwacht und verwaltet die Token-Nutzung, um Kontextüberläufe zu verhindern.
- Sandboxing für Befehlsausführung: macOS Seatbelt + Linux Landlock + seccomp + tree-sitter-bash-Validierung für jeden modellgenerierten Befehl. Der Agent bleibt im Arbeitsbereich.
- Benutzerdefinierte OpenAI-kompatible Anbieter: Einfach jeden Drittanbieter-Endpunkt mit einem Konfigurationsblock einbinden.
Ausführung mit DeepSeek V4 Flash
Der Autor hat VTCode mit DeepSeek V4 Flash über den Atlas Cloud Endpunkt für geringere Latenz während Stoßzeiten gekoppelt. Die Konfiguration ist einfach:
[agent]
provider = "atlas"
default_model = "deepseek-ai/deepseek-v4-flash"
[[custom_providers]]
name = "atlas"
base_url = "https://api.atlascloud.ai/v1"
api_key_env = "ATLAS_API_KEY"
model = "deepseek-ai/deepseek-v4-flash"
Der Agent unterstützt nativ OpenAI-kompatible Anbieter, also funktioniert jeder ähnliche Host – der Autor hat Atlas nur verwendet, weil er bereits einen Schlüssel hatte.
Für wen es geeignet ist
Entwickler, die einen schlanken, kontextbewussten TUI Agent für Programmieraufgaben suchen, ohne Tokens für irrelevante Dateien zu verschwenden oder sich um die Befehlssicherheit sorgen zu müssen.
📖 Vollständige Quelle lesen: r/LocalLLaMA
👀 Siehe auch

Freier Zauberer migriert ChatGPT-Verlauf zu Claude-Projekten — Wichtige Lektionen zu Token-Limits und RAG
Ein kostenloses No-Code-Tool führt ChatGPT-Exporte in Claude-Projekte ein und zeigt, dass 26 MB große JSON-Dateien an Token-Grenzen stoßen – die Lösung ist eine themenbasierte Aufteilung. Claude's RAG liest nur Teile großer Dateien, daher eignen sich spezifische Abfragen am besten.

Mobile Harness: Browser-Use-Fähigkeiten für Claude-Agenten in Mobile Apps integrieren
Mobile Harness gibt Claude/Agenten wiederverwendbare mobile App-Fähigkeiten (Reddit, Instagram, TikTok) unter Verwendung von MobAI als Ausführungsschicht. Funktioniert mit echten Geräten, Emulatoren, Simulatoren, kostenloses tägliches Kontingent.

CLI-Anything-WEB: Open-Source-Plugin, das jede Website in ein Python-CLI für Claude Code zurückentwickelt
CLI-Anything-WEB ist ein Open-Source-Claude-Code-Plugin, das Ihren Browserverkehr überwacht, das Protokoll rückentwickelt und ein vollständiges Python-CLI mit Authentifizierung, Tests und --json-Unterstützung generiert. 19 Beispiel-CLIs für Seiten wie Reddit, Booking, Airbnb, ChatGPT und LinkedIn sind enthalten.

Claude Code UltraPlan Workflow-Änderungen und Leistungsbeobachtungen
Claude Code UltraPlan stellt einen cloudbasierten Planungsworkflow mit Terminalstart, Browser-Review-Oberfläche und Ausführungsoptionen vor. Tests zeigten etwa 2x schnellere Wiederholungsläufe als lokale Planung, mit gemischten Qualitätsverbesserungen.