Пи-кодирующий агент с Qwen 35B Q2: Использование файловой системы как внешней памяти и обеспечение контекстных ограничений

✍️ OpenClawRadar📅 Опубликовано: 11 мая 2026 г.🔗 Source
Пи-кодирующий агент с Qwen 35B Q2: Использование файловой системы как внешней памяти и обеспечение контекстных ограничений
Ad

Пользователь Reddit поделился своим подходом к агентному кодингу с локальными LLM, построенным на Pi coding agent с Qwen 35B (квант Q2_K_XL через LM Studio). Ключевая идея: рассматривать LLM как процессор логики, а не как базу данных контекста. Реализация применяет строгие ограничения на уровне API — модель не может их обойти.

Ключевые ограничения, налагаемые системой

  • Лимит записи/редактирования: Отклоняет любой вывод длиннее 100 строк. Модель должна сначала написать скелет, затем заполнять по одному разделу за раз. Если она пытается выгрузить полный файл, вызов блокируется с инструкцией разделить работу.
  • Лимит блока размышлений: Если рассуждения модели превышают 2000 символов, она получает корректировку — записать выводы на диск и двигаться дальше.
  • Мониторинг контекста: При 65% использования контекста модели предписывается записать своё состояние в файлы. При 80% всё останавливается — модель записывает свой 'мозг' на диск, пока ещё связно.
  • Постоянный вывод: Если модель даёт длинный ответ без записи файла, ей поручается сохранить результаты в файл шага. Ничто не остаётся только в контексте.

Структура внешней памяти

Система использует каталоги .think/ и .plan/ как внешнюю память модели. Каждый шаг, решение и вывод записываются в файл. При сжатии контекста модель читает свои собственные заметки. Цель сессии сохраняется отдельно в _purpose.md и повторно внедряется после сжатия контекста, сохраняя изначальную задачу.

Ad

Дистилляция знаний

Команда /distill обходит кодовую базу, строит граф импорта, топологически сортирует файлы и заставляет модель резюмировать их по одному за раз в базу знаний. Манифест разбивается на страницы по 50 файлов, чтобы не расходовать весь контекст. Пользователи могут помещать файлы вроде svelte5-gotchas.md или astro-gotchas.md в папку знаний; отдельный вызов LLM выбирает, какие из них релевантны текущей задаче, и только их содержимое внедряется в основной разговор.

Реальный результат

Пользователь попросил модель создать игру-симулятор полёта на Three.js. Первая попытка выдать 652 строки за один вызов была отклонена защитой. Модель перепланировала, написала скелет, а затем заполняла функции по одной правке за раз. Итогом стала рабочая игра с 3D-моделью самолёта, препятствиями, HUD, миникартой и экранами начала/конца игры — всё на Q2 кванте.

Полная настройка работает на квантовании Q2_K_XL как минимальном; пользователь отмечает, что Q4 или Q8 должны дать лучшие результаты. Код доступен на GitHub: github.com/Kodrack/Pi-forge.

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Mandala v0.3: Открытая асинхронная среда выполнения для унификации логистической телеметрии в виде OpenTelemetry-спанов для рассуждений агентов
Инструменты

Mandala v0.3: Открытая асинхронная среда выполнения для унификации логистической телеметрии в виде OpenTelemetry-спанов для рассуждений агентов

Mandala v0.3 — это асинхронный рантайм с открытым исходным кодом, который получает телеметрию от Samsara, Descartes, Vizion и FMCSA через вебхуки, генерирует события в виде Span OpenTelemetry и предоставляет данные через MCP-инструменты для LLM-агентов.

OpenClawRadar
Mneme: бесплатный локальный клиент чата Claude с постоянной памятью
Инструменты

Mneme: бесплатный локальный клиент чата Claude с постоянной памятью

Mneme — это бесплатный, открытый, локальный чат-клиент для Claude с многоуровневой памятью, отслеживанием сущностей, ежедневными сводками и поддержкой Sonnet 4.5 через Anthropic API.

OpenClawRadar
Плагин Claude Code с открытым исходным кодом захватывает книги и преобразует их в структурированный Markdown.
Инструменты

Плагин Claude Code с открытым исходным кодом захватывает книги и преобразует их в структурированный Markdown.

Разработчик опубликовал в открытом доступе плагин Claude Code, который автоматически делает скриншоты страниц книг, выполняет OCR с помощью macOS Vision и создает структурированные Markdown-файлы, организованные по темам, а не по порядку глав. Инструмент поддерживает Kindle, Apple Books, Kindle Cloud Reader и отсканированные PDF-файлы на macOS.

OpenClawRadar
Токен-усилитель сокращает использование токенов веб-страниц для ИИ-агентов.
Инструменты

Токен-усилитель сокращает использование токенов веб-страниц для ИИ-агентов.

Разработчик обнаружил, что необработанный HTML из веб-запросов потребляет чрезмерное количество токенов в контексте ИИ-агента: страницы Yahoo Finance использовали 704 тыс. токенов. Применение Token Enhancer в качестве MCP-сервера сократило этот показатель до 2,6 тыс. токенов.

OpenClawRadar