TREX: Greptiles AI-Code-Reviewer, der Ihren Code ausführt

Greptile hat TREX (Test, Run, Execute) veröffentlicht, eine Ausführungsebene, die Ihren Code während des KI-gestützten Code-Reviews ausführt. Anstatt nur Diffs zu lesen, führt TREX den geänderten Code tatsächlich aus und deckt Laufzeitfehler auf – UI-Regressionen, zustandsabhängige Logikfehler, Race Conditions – die die statische Analyse nicht erkennen kann.
Architektur: Orchestrator + Subagents pro Problem
Frühere Versionen versuchten separate Agents oder einen einzigen kombinierten Agenten. Beide scheiterten: Separate Agents duplizierten Arbeit ohne gemeinsamen Kontext; ein einzelner Agent war überfordert mit der Verwaltung von Setup, Screenshots und Tests. Die Lösung war ein Orchestrator-Agent (der Haupt-Greptile-Reviewer), der den Diff liest, verdächtige Probleme identifiziert und einen dedizierten TREX-Subagenten pro Problem startet, die alle parallel laufen. Jeder Subagent erbt den Kontext des Orchestrators und hat sein eigenes Kontextfenster, das auf seine spezifische Untersuchung zugeschnitten ist.
Beispiel: eine UI-Funktion hinter einer Authentifizierungssperre. Ein Subagent richtet autonom die Umgebung ein, kümmert sich um die Authentifizierung, schaltet Feature-Flags um und gibt einen Screenshot der gerenderten Funktion zurück.
Multimodale Artefakte vs. Aufzählungspunkte
Die erste TREX-Ausgabe bestand aus zusammenfassenden Aufzählungspunkten – aber Aufzählungspunkte erlaubten Halluzinationen (z. B. die Behauptung, ein Test sei bestanden, obwohl er es nicht war) und boten keine Möglichkeit zur Überprüfung. Die Lösung: Jeder TREX-Befund wird durch einen Satz multimodaler Artefakte untermauert: Screenshots, Ausführungsprotokolle, API-Traces und Ausführungsskripte. Jede Modalität erzählt einen Teil der Geschichte und ermöglicht es, genau nachzuvollziehen, was passiert ist. Das erste Artefakt, das das Team beeindruckte, war eine Video-Aufnahme einer Animationsänderung – die den tatsächlichen Laufzeiteffekt zeigt.
Was es erwischt
TREX zielt auf Fehler ab, die nicht in Code-Diffs auftauchen: Logikfehler, die bestimmte Zustandssequenzen erfordern, UI-Regressionen nach dem Seitenladen und Race Conditions, die echte Anfragen benötigen. Es generiert und führt Tests aus, aber der Fokus liegt auf dem Finden von Fehlern, nicht nur auf dem Schreiben von Tests. Der Subagent findet das Setup selbst heraus.
Wie Shlok Mehrotra, der Ingenieur hinter TREX, es ausdrückt: „Man kann den Diff perfekt lesen und diese Art von Fehlern dennoch völlig übersehen.“
📖 Lesen Sie die vollständige Quelle: HN AI Agents
👀 Siehe auch

Entwickler baut KI-Framework mit 17 biologischen Prinzipien unter Verwendung von Claude Code
Ein Entwickler hat ein KI-Framework namens Cognitive Sparks erstellt, indem er 17 biologische Prinzipien wie Schwellenwertfeuerung und Hebb'sche Plastizität implementierte, basierend auf dem Buch 'Sparks of Genius' von 1999. Das gesamte Projekt – 22 Design-Dokumente und 3.300 Codezeilen – wurde an einem Tag mit Claude Code erstellt, ohne von Menschen geschriebenen Code.

Skales Desktop AI Agent, entwickelt mit Claude, verfügt über einen Clippy-ähnlichen Maskottchen-Stil
Skales ist ein Desktop-KI-Agent, der lokal auf Windows und macOS läuft und Claude über die OpenRouter/Anthropic-API für logisches Denken und Werkzeugausführung nutzt. Er beinhaltet ein schwebendes Desktop-Buddy-Maskottchen mit einem Büroklammer-Skin-Referenz und kann Befehle wie E-Mails senden, Dateien verwalten, im Web surfen und Kalender verwalten ausführen.

ClawControl v1.7.1 behebt Probleme bei der täglichen Nutzung des OpenClaw-Clients.
ClawControl v1.7.1 ist ein Open-Source-Client für OpenClaw, der für Windows, Mac, Linux, iOS und Android verfügbar ist. Diese Version konzentriert sich auf die Behebung von 'Warum macht es das?'-Problemen, die bei der täglichen Nutzung von OpenClaw auftreten.

Vier ClawHub-Fähigkeiten für Echtzeit-Suchdaten in KI-Agenten
Vier ClawHub-Fähigkeiten bieten strukturierte Suchfunktionen für KI-Agenten: Google (Web, Nachrichten, Bilder, Karten), Amazon (Produktsuche über 12 Marktplätze), Walmart (Produktsuche mit Lieferfiltern) und YouTube (Videosuche mit Transkripten). Installation über clawhub install-Befehle mit einem API-Schlüssel.