AutoBe: Как слабые локальные LLM исправили архитектуру генератора AI-бэкенда

✍️ OpenClawRadar📅 Опубликовано: 27 февраля 2026 г.🔗 Source
AutoBe: Как слабые локальные LLM исправили архитектуру генератора AI-бэкенда
Ad

Что произошло

AutoBe — это открытый ИИ-агент, который генерирует полноценные бэкенд-приложения с использованием TypeScript, NestJS и Prisma. Изначально он достигал 100% успешной компиляции, но код был неподдерживаемым — не было повторного использования кода, поэтому любое небольшое изменение требовало перегенерации всего. Команда перестроила систему вокруг модульной генерации кода, что сразу же снизило показатель успеха до 40%.

Прорыв в отладке

Когда новая архитектура ввела зависимости между модулями, команда использовала намеренно слабые локальные LLM для поиска ошибок, о существовании которых они не подозревали. Модель qwen3-30b-a3b-thinking имела успех около 10% и выявляла неоднозначности в AST-схемах и некорректные структуры. Модель qwen3-next-80b-a3b-instruct имела успех около 20% и выявляла несоответствия типов и крайние случаи во вложенных отношениях.

Такой низкий показатель успеха оказался ценным: каждое исправление укрепляло всю систему. Когда схема достаточно точна, чтобы 30B-модель не могла её неверно интерпретировать, более мощные модели тоже не ошибаются. Этот подход также подчёркивает преимущество локальных LLM в стоимости — обнаружение крайних случаев требует сотен циклов генерация-компиляция-диагностика, что было бы непомерно дорого по ценам облачных API.

Ad

Архитектурный сдвиг

Команда перешла от инженерии промптов к проектированию схем с валидационной обратной связью. Они свели системные промпты почти к нулю и перенесли все ограничения в схемы вызова функций, позволяя валидационной обратной связи выполнять обучение. AutoBe использует три типа AST, которые особенно сложны для генерации LLM: AutoBeDatabase (модели Prisma, отношения, индексы), AutoBeOpenApi (схемы OpenAPI, конечные точки, DTO) и AutoBeTest (30+ типов выражений).

Эти структуры сложны, потому что включают неограниченные объединения типов, неограниченную глубину и рекурсивные ссылки. Например, AST компилятора включает такие типы, как IArrayLiteralExpression и IObjectLiteralExpression, которые содержат рекурсивные ссылки на IExpression[].

Результаты

Только за счёт валидационной обратной связи команда улучшила показатель с 6,75% успешных вызовов функций до 100%. Сейчас они снова достигли 100% успеха с GLM v5, а другие локальные модели также демонстрируют рост производительности.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Управление узлами: многопользовательская игра .io в реальном времени, полностью созданная с помощью Claude 4.6 и 4.7
Инструменты

Управление узлами: многопользовательская игра .io в реальном времени, полностью созданная с помощью Claude 4.6 и 4.7

Разработчик создал живую многопользовательскую конкурентную .io игру Node Control с помощью Claude 4.6 и 4.7. Особенности: серверный сетевой код с авторитетом на 60 Гц, развертывание в 4 регионах на fly.io и эстетика нейронной сети.

OpenClawRadar
Sitefire автоматизирует оптимизацию поиска с помощью ИИ через контент-агентов.
Инструменты

Sitefire автоматизирует оптимизацию поиска с помощью ИИ через контент-агентов.

Платформа Sitefire отслеживает результаты поиска ИИ, анализирует, какие страницы цитируются, и использует контент-агентов для составления улучшений или создания новых страниц, которые напрямую отправляются в CMS клиентов. Один клиент увидел увеличение запросов от ИИ-ботов с примерно 200/день до примерно 570/день в течение десяти дней.

OpenClawRadar
Сервер MCP для проектов на TypeScript заменяет поиск по шаблону Grep в Claude Code на индексированный поиск символов
Инструменты

Сервер MCP для проектов на TypeScript заменяет поиск по шаблону Grep в Claude Code на индексированный поиск символов

Разработчик создал MCP-сервер, который заменяет паттерн grep-and-guess в Claude Code на индексированный поиск символов для TypeScript-проектов. Инструмент поддерживает живой SQLite-индекс символов, мест вызова, импортов и иерархии классов, сокращая использование токенов на 63–79% в тестах.

OpenClawRadar
Подчинённый агент Claude Code, настроенный скептически к планам, выявляет уязвимости безопасности в сгенерированных планах.
Инструменты

Подчинённый агент Claude Code, настроенный скептически к планам, выявляет уязвимости безопасности в сгенерированных планах.

Разработчик обнаружил скептически настроенный суб-агент Claude Code, который выявляет пробелы и проблемы в планах разработки, сгенерированных ИИ, особенно находя проблемы безопасности, которые изначально не были очевидны. Этот агент работает вместе с ранее известным суб-агентом security-sheriff для повышения качества планов.

OpenClawRadar