Использование меньшей модели в качестве гигиенического слоя во время выполнения повышает надежность агента OpenClaw.

✍️ OpenClawRadar📅 Опубликовано: 14 марта 2026 г.🔗 Source
Использование меньшей модели в качестве гигиенического слоя во время выполнения повышает надежность агента OpenClaw.
Ad

Проблема: Неряшливые ответы ухудшают работу долго работающих агентов

При локальном запуске OpenClaw на Mac Studio M4 (36 ГБ) с Qwen 3.5 27B (4-бит, oMLX) в качестве домашнего агента модель не теряла способностей со временем — она становилась неряшливой. Конкретные проблемы включали:

  • Утечки вызовов инструментов в виде сырого текста вместо структурированного использования инструментов
  • Просачивание мыслей планирования в финальные ответы
  • Повторение результатов инструментов и текста политики обратно пользователю
  • Некорректные выходные данные, отравляющие контекст и вызывающие деградацию с каждым последующим ходом

Основная проблема заключалась не в возможностях, а в гигиене времени выполнения: модель знала, что делать, но не справлялась с правильным поведением в среде выполнения OpenClaw.

Решение: Четырехуровневая архитектура для гигиены времени выполнения

Разработчик реализовал четырехуровневый подход, который оказался эффективнее простого использования большей модели:

  • Суммаризация: Сжатие контекста через lossless-claw (на основе DAG, freshTailCount=12, contextThreshold=0.60). Это дало самое значительное улучшение.
  • Шериф: Проверки по регулярным выражениям и эвристикам, которые отлавливают некорректные ответы до их попадания в OpenClaw. Это предотвращает превращение утекшей разметки инструментов, болтовни планировщика и сырого JSON в устойчивый контекст.
  • Судья: Меньшая, более дешевая модель, которая классифицирует пограничные выходные данные как «валидный финальный ответ» или «мусор». Эта модель не для интеллекта, а для гигиены времени выполнения — это иммунная система, а не второй мозг. Она также обрабатывает всю суммаризацию для lossless-claw.
  • Оземпик (внутреннее название): Агрессивная очистка памяти, которая гарантирует, что модель в будущих ходах перечитывает только запросы пользователя, финальные ответы и сжатые факты, полученные от инструментов — а не болтовню планировщика, сырой JSON инструментов, артефакты повторных попыток или внутренний диалог о политике.
Ad

Почему это лучше, чем использовать большую модель

Одна модель должна одновременно решать задачи, поддерживать форматирование, управлять связностью контекста, избегать самоотравления собственными выходами и восстанавливаться после плохих выходных данных — что особенно сложно при локальных уровнях квантования. Разделение обязанностей, когда основная модель выполняет работу, а меньшая модель поддерживает гигиену времени выполнения, оказалось эффективнее, чем добавление большего количества параметров.

Результат: Устойчивая работа без сбросов

Этот подход позволил перейти от необходимости сбросов /new каждые 20-30 минут к устойчивой работе в одной сессии на Mac Studio M4 с 36 ГБ ОЗУ, полностью локально, без вызовов API.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Разработчик делится проблемой стоимости токенов в ERP-системе, созданной с помощью Claude.
Кейсы

Разработчик делится проблемой стоимости токенов в ERP-системе, созданной с помощью Claude.

Владелец бизнеса по грузоперевозкам создал ERP-систему на 3000+ строк кода с помощью Claude, но теперь сталкивается с затратами в 60 000–80 000 токенов на сообщение из-за загрузки всего единого HTML-файла. Они рассматривают модуляризацию или миграцию на Firebase для снижения затрат.

OpenClawRadar
OpenCLAW для VPS против Mac Mini: почему VPS за $5 побеждает Mac Mini за $599 для продакшн-агентов
Кейсы

OpenCLAW для VPS против Mac Mini: почему VPS за $5 побеждает Mac Mini за $599 для продакшн-агентов

Создатель OpenCLAW Питер Штайнбергер призвал пользователей не покупать Mac Mini, а вместо этого спонсировать разработчиков. VPS за €5 с 2 vCPU и 4 ГБ ОЗУ справляется с непрерывными нагрузками OpenCLAW при 3-8% CPU, в то время как Mac Mini стоит от $599 плюс $10-15 в месяц за электричество.

OpenClawRadar
Агент Джем: ИИ-агенты сотрудничают в Godot Game Jam через GitHub
Кейсы

Агент Джем: ИИ-агенты сотрудничают в Godot Game Jam через GitHub

Agent Jam — это игровой джем, в котором ИИ-агенты создают веб-игру на Godot 4.4 в GitHub без кода, написанного людьми. Проект использует GitHub Issues для обсуждения дизайна, CI-валидацию для PR и требует, чтобы игры были доступны для игры в вебе через экспорт Godot HTML5.

OpenClawRadar
Гибридный RAG для локальной памяти агента с использованием OpenClaw, Ollama и nomic-embed-text
Кейсы

Гибридный RAG для локальной памяти агента с использованием OpenClaw, Ollama и nomic-embed-text

Разработчик реализовал гибридный поиск RAG для памяти AI-агента с использованием OpenClaw с Ollama и nomic-embed-text, сочетая 70% векторного сходства с 30% ключевого соответствия BM25. Настройка работает локально без внешних API и включает дедупликацию MMR и временное затухание весов.

OpenClawRadar