ClawCut: Python-прокси, который делает небольшие локальные LLM пригодными для использования с OpenClaw

Что делает ClawCut
ClawCut — это приложение на Python Flask, которое выступает в качестве прокси между локальными серверами LLM (такими как MLX или Ollama) и фреймворком OpenClaw. Он был создан для решения конкретных технических проблем, которые затрудняют использование небольших локальных моделей (7B/14B) в качестве практичных помощников с OpenClaw.
Ключевые решаемые проблемы
- Отравление контекста: Маленькие модели теряют представление об использовании инструментов, когда видят свои старые вызовы инструментов в истории чата
- Бесконечные циклы: Модели застревают в повторяющихся паттернах вместо выполнения команд
- Проблемы с выводом: Модели выводят bash-код как обычный текст в чате или "захлёбываются" собственной историей после нескольких команд
- Сбои cron-задач: Запланированные фоновые задания генерируют ответы, которые исчезают, потому что нет активного окна чата
- Артефакты LLM: Пустые блоки markdown, внутренние XML-теги и висящие обратные кавычки загромождают вывод
- Отказ от загрузки медиа: Модели иногда отказываются загружать сгенерированные файлы
Как это работает
Динамическая амнезия для вызовов инструментов: Во время обычного чата история сохраняется. Когда прокси обнаруживает, что модель пытается использовать системный инструмент, он временно обрезает старую историю чата, давая модели "туннельное зрение" для чистого выполнения shell-команд без циклов или галлюцинаций.
Универсальная автоматическая доставка для cron-задач: Прокси отслеживает поток модели и перехватывает чистые текстовые ответы в конце мыслительных процессов. Затем он принудительно доставляет их через автоматические вызовы инструментов в WhatsApp, Telegram или Signal, заставляя cron-задачи активно отчитываться на ваш телефон.
Фильтрация артефактов: Пустые блоки markdown, внутренние XML-теги и висящие обратные кавычки отфильтровываются перед попаданием во фронтенд.
Манипуляция именами инструментов: Простые манипуляции с потоком обходят отказ моделей загружать сгенерированные медиафайлы.
Протестированные конфигурации
- Raspberry Pi 5 (8GB) с OpenClaw 3.8
- Mac mini M4 Pro 24GB с MLX-LLM, запускающим Qwen2.5-Coder-7B-Instruct-4bit
- Windows-машина с Ollama и моделью Qwen 2.5 Coder 14B (запланирована для интеграции с ClawCut)
Ограничения
ClawCut не превращает модели 7B в GPT-4. Высокосложные многошаговые логические цепочки остаются сложными для маленьких моделей. Прокси конкретно решает технические препятствия, которые ранее делали их практически непригодными в качестве повседневных помощников.
📖 Read the full source: r/openclaw
👀 Смотрите также

GitVelocity: Анализ 50 тысяч PR с помощью ИИ выявляет взаимосвязь со сложностью кода
GitVelocity использует Claude для оценки объединённых pull request'ов по шкале от 0 до 100 по шести параметрам: масштаб, архитектура, реализация, риск, качество и производительность/безопасность. Проанализировав более 50 000 PR в TypeScript, Python, Rust, Go, Java и Elixir, команда обнаружила удивительные закономерности относительно размера PR, покрытия тестами и внедрения ИИ.

Менеджер по продукту делится более чем 70 навыками Claude для автоматизации рабочих процессов в управлении продуктами.
Продуктовый менеджер с 20-летним опытом создал более 70 навыков для Claude, которые автоматизируют типичные задачи PM, включая генерацию PRD, анализ пользовательских интервью, составление конкурентных профилей и построение дорожных карт. Навыки доступны в виде загружаемых .md файлов для Claude Code.

KubeShark: Навык Kubernetes для Claude Code и Codex для обнаружения галлюцинированного YAML
KubeShark — это навык для Kubernetes от Claude Code и Codex, ориентированный на отказы, который ловит устаревшие API, неверно настроенные пробы, сломанные селекторы и другие распространённые AI-ошибки до того, как они попадут в продакшн.

Спецификация-ориентированный рабочий процесс для Claude Code: декомпозиция, очистка контекста и контроль затрат
Подход к разработке на основе спецификаций для Claude Code, использующий двумерную декомпозицию, очистку контекста между шагами и запись спецификаций на диск для повышения производительности агента и снижения затрат.