AutoBe: Wie schwache lokale LLMs die Architektur eines KI-Backend-Generators verbesserten

Was geschah
AutoBe ist ein Open-Source-KI-Agent, der vollständige Backend-Anwendungen mit TypeScript, NestJS und Prisma generiert. Anfangs erreichte er 100% Kompilierungserfolg, aber der Code war unwartbar – es gab keine Wiederverwendung von Code, sodass jede kleine Änderung eine Neugenerierung von allem erforderte. Das Team baute das System um modulare Codegenerierung herum neu auf, was die Erfolgsrate sofort auf 40% abstürzen ließ.
Der Debugging-Durchbruch
Als die neue Architektur Abhängigkeiten zwischen Modulen einführte, nutzte das Team absichtlich schwache lokale LLMs, um Fehler zu finden, von denen sie nicht wussten, dass sie existierten. Das qwen3-30b-a3b-thinking-Modell hatte eine Erfolgsrate von etwa 10% und deckte AST-Schema-Mehrdeutigkeiten und fehlerhafte Strukturen auf. Das qwen3-next-80b-a3b-instruct-Modell hatte eine Erfolgsrate von etwa 20% und offenbarte Typinkonsistenzen und Randfälle in verschachtelten Beziehungen.
Diese niedrige Erfolgsrate war wertvoll: Jede Korrektur straffte das gesamte System. Wenn ein Schema präzise genug ist, dass ein 30B-Modell es nicht falsch interpretieren kann, werden stärkere Modelle es ebenfalls nicht falsch verstehen. Dieser Ansatz hebt auch den Kostenvorteil lokaler LLMs hervor – das Aufdecken von Randfällen erfordert Hunderte von Generierungs-Kompilierungs-Diagnose-Zyklen, was zu Cloud-API-Preisen unerschwinglich teuer wäre.
Architekturwechsel
Das Team wechselte von Prompt-Engineering zu Schema-Design mit Validierungsfeedback. Sie reduzierten System-Prompts auf fast nichts und verlagerten alle Einschränkungen in Funktionsaufruf-Schemas, sodass das Validierungsfeedback die Lehre übernahm. AutoBe verwendet drei AST-Typen, die für LLMs besonders herausfordernd zu generieren sind: AutoBeDatabase (Prisma-Modelle, Beziehungen, Indizes), AutoBeOpenApi (OpenAPI-Schemas, Endpunkte, DTOs) und AutoBeTest (30+ Ausdruckstypen).
Diese Strukturen sind schwierig, weil sie unbegrenzte Union-Typen, unbegrenzte Tiefe und rekursive Referenzen beinhalten. Beispielsweise enthält der Compiler-AST Typen wie IArrayLiteralExpression und IObjectLiteralExpression, die rekursive Referenzen zu IExpression[] enthalten.
Ergebnisse
Allein durch Validierungsfeedback verbesserte sich das Team von 6,75% rohem Funktionsaufruf-Erfolg auf 100%. Sie sind jetzt mit GLM v5 wieder bei 100% Erfolg, und andere lokale Modelle steigen in der Leistung.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Der Knowledge Guy: Verwandle dein Bücherregal mit Claude Code Fähigkeiten in einen Tutor
Ein Claude Code Skill, der Ihre PDF-/EPUB-Bücher lokal verarbeitet und es Ihnen ermöglicht, Fragen zu stellen, sich thematisch unterrichten zu lassen oder Spickzettel zu erstellen – alles mit Quellenangaben aus Ihrer Bibliothek.

NGX-OS: Netzwerkbetriebssystem für KI entwickelt mit eBPF und MCP-Integration
NGX-OS ist ein Netzwerkbetriebssystem, das von Grund auf für die KI-Integration entwickelt wurde und eBPF für Echtzeit-Telemetrie sowie MCP für den direkten Zugriff von LLMs auf Netzwerkstatusdaten ohne Übersetzungsschichten nutzt.

OpenClaw Browser Relay Chrome-Erweiterung als Alternative zu manuellen Konfigurationen
Ein Reddit-Nutzer berichtet von Erfolg mit einer Chrome-Erweiterung für das OpenClaw-Browser-Relay, nachdem manuelle Konfigurationsversuche Systemabstürze und Debugging-Frust verursacht hatten.

KI-Chat-Exporter: Eine Chrome-Erweiterung für hochwertige Claude-Konversations-PDFs
Ein Entwickler hat AI Chat Exporter erstellt, eine Chrome-Erweiterung, die Mathematik, Code und Bilder bewahrt, wenn Claude-Konversationen in PDF exportiert werden. Das Tool verwendet eine lokale, browserbasierte Rendering-Engine, die mit Claude 3.5 Sonnet entwickelt wurde, um progressive Markdown- und LaTeX-Formatierung zu verarbeiten.