Многомодельный рабочий процесс проверки кода, упакованный как переиспользуемый навык

✍️ OpenClawRadar📅 Опубликовано: 5 июня 2026 г.🔗 Source
Многомодельный рабочий процесс проверки кода, упакованный как переиспользуемый навык
Ad

Разработчик упаковал многомодельный workflow ревью кода как многоразовый навык/runbook, доступный на GitHub. Подход использует один агент-оркестратор, координирующий несколько независимых агентов-ревьюеров/моделей, затем объединяет результаты в итоговый обзор. Ключевая идея: разные модели находят разные ошибки, и когда несколько моделей независимо указывают на одну и ту же проблему, уверенность возрастает. Оркестратор дедуплицирует, отфильтровывает слабые находки, проверяет очевидные ложные срабатывания и публикует один чистый результат.

Два режима

Workflow поддерживает два режима:

  • Ревью PR: подготавливает локальные base/, head/, PR_DIFF.patch и PR_METADATA.json, запускает несколько ревьюеров только для анализа, затем оркестратор публикует одно сводное резюме и инлайн-комментарии в PR. Разработан для избежания коллизий с pending-review в GitHub.
  • Ревью не-PR области: проверка папки/модуля/развертывания/скриптов; ревьюеры просматривают общий локальный снимок; оркестратор публикует консолидированный REVIEW.md в репозиторий.
Ad

Протестированная конфигурация моделей

В тестовой конфигурации используется GPT-5.5 как оркестратор, а GPT-5.5, DeepSeek V4 Pro, Kimi K2.6, Qwen 3.6 Plus и GLM-5.1 как ревьюеры. Однако workflow не привязан к конкретной модели/агенту. Он протестирован с OpenClaw и, как сообщается, даёт отличные результаты.

Ключевые уроки

  • Общий снимок: не позволяйте каждому сабагенту самостоятельно клонировать/загружать репозиторий. Оркестратор должен подготовить общий снимок и передать локальные пути ревьюерам. Быстрее, дешевле и меньше странных ложных срабатываний.
  • Все не-GPT модели запускались через Fireworks. Для больших задач автор предлагает заменить Kimi и Qwen на что-то другое, так как эти две иногда зависают.

Репозиторий находится по адресу github.com/rmichelena/multireview. Автор ищет обратную связь, особенно от тех, кто использует многомодельные workflow ревью кода.

📖 Читать полный источник: r/openclaw

Ad

👀 Смотрите также

OpenClaw как интерфейс "Инфраструктура как код" для управления домашней лабораторией
Инструменты

OpenClaw как интерфейс "Инфраструктура как код" для управления домашней лабораторией

OpenClaw превратился из крутого AI-гаджета в основной интерфейс для управления компьютером, особенно во время перестройки и обновления домашней лаборатории. Инструмент работает в собственной виртуальной машине, обеспечивая прямой доступ к инфраструктуре вашего компьютера.

OpenClawRadar
Flash-MoE: Запуск модели Qwen с 397 миллиардами параметров на MacBook Pro с использованием чистого C/Metal
Инструменты

Flash-MoE: Запуск модели Qwen с 397 миллиардами параметров на MacBook Pro с использованием чистого C/Metal

Flash-MoE — это чисто C/Metal-движок для вывода, который запускает модель Qwen3.5-397B-A17B, смесь экспертов с 397 миллиардами параметров, на MacBook Pro с 48 ГБ оперативной памяти со скоростью 4.4+ токена в секунду. Модель объёмом 209 ГБ загружается с SSD через пользовательские Metal compute-шейдеры без использования Python или фреймворков.

OpenClawRadar
Тесты локальных LLM на RTX 5060 Ti 16 ГБ: Модели на 30 млрд параметров по-прежнему лидируют в программировании.
Инструменты

Тесты локальных LLM на RTX 5060 Ti 16 ГБ: Модели на 30 млрд параметров по-прежнему лидируют в программировании.

Тесты на RTX 5060 Ti 16GB показывают, что модель Unsloth Qwen3-Coder-30B UD-Q3_K_XL достигает 76.3 ток/с на Ubuntu с оценкой качества 8.14, что делает её рекомендуемой моделью по умолчанию для кодирования. Модель Unsloth Qwen3.5-35B UD-Q2_K_XL достигает 80.1 ток/с, но с более низкими оценками качества.

OpenClawRadar
BetterClaw против OpenClaw: Сравнение вызова инструментов, структурированных выводов и управления рабочим процессом
Инструменты

BetterClaw против OpenClaw: Сравнение вызова инструментов, структурированных выводов и управления рабочим процессом

Сравнение BetterClaw и OpenClaw для разработчиков: вызов инструментов, структурированные выходные данные, контроль рабочих процессов и повседневная разработка агентов.

OpenClawRadar