OmniCoder-9B демонстрирует высокую производительность для агентного кодирования на системах с 8 ГБ видеопамяти.

✍️ OpenClawRadar📅 Опубликовано: 13 марта 2026 г.🔗 Source
OmniCoder-9B демонстрирует высокую производительность для агентного кодирования на системах с 8 ГБ видеопамяти.
Ad

Результаты тестирования производительности OmniCoder-9B с OpenCode

Пользователь на r/LocalLLaMA сообщил о тестировании OmniCoder-9B, дообученной версии Qwen3.5-9B, обученной на трейсах Opus, и обнаружил, что она хорошо справляется с агентными задачами программирования на системах с ограниченным объёмом видеопамяти. Модель доступна на Hugging Face по адресу Tesslate/OmniCoder-9B.

Техническая настройка и конфигурация

Пользователь запустил квантование Q4_K_M GGUF с помощью ik_llama следующей командой:

ik_llama.cpp\build\bin\Release\llama-server.exe -m models/Tesslate/OmniCoder-9B-GGUF/omnicoder-9b-q4_k_m.gguf -ngl 999 -fa 1 -b 2048 -ub 512 -t 8 -c 100000 -ctk f16 -ctv q4_0 --temp 0.4 --top-p 0.95 --top-k 20 --presence-penalty 0.0 --jinja --ctx-checkpoints 0

С такой конфигурацией была достигнута скорость примерно 40 токенов в секунду. Пользователь отметил, что квантование Q5_KS с длиной контекста 64 000 обеспечивает схожую скорость.

Ad

Конфигурация OpenCode

Конфигурация OpenCode, использованная для тестирования:

"local": { "models": { "/models/Tesslate/OmniCoder-9B-GGUF/omnicoder-9b-q4_k_m.gguf": { "interleaved": { "field": "reasoning_content" }, "limit": { "context": 100000, "output": 32000 }, "name": "omnicoder-9b-q4_k_m", "reasoning": true, "temperature": true, "tool_call": true } }, "npm": "@ai-sdk/openai-compatible", "options": { "baseURL": "http://localhost:8080/v1" } }

Пользователь упомянул о возможной ошибке, вызывающей полную переобработку промпта, которую он исследует.

Контекст и сравнение

Тестирование было мотивировано опасениями по поводу ограничений квот и изменений цен в коммерческих инструментах ИИ для программирования. Пользователь конкретно упомянул наличие 8 ГБ видеопамяти, что обычно ограничивает возможность запуска производительных моделей с открытым исходным кодом на хорошей скорости для агентного программирования. Он отметил, что хотя MOE-модели могут предлагать лучшую производительность, их скорость значительно ниже.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Агент OpenClaw сохраняет память при переходе с подписки Claude на API.
Инструменты

Агент OpenClaw сохраняет память при переходе с подписки Claude на API.

Разработчик сообщает об успешной миграции своей настройки OpenClaw с подписки Claude на API-ключ без потери памяти агента, используя навык mengram-memory, который сохраняет данные во внешний слой. Агент сохранил ~100+ изученных фактов, развитые процедуры и эпизодические воспоминания.

OpenClawRadar
Представляем operate.txt: спецификация в формате YAML для ИИ-агентов, взаимодействующих с SaaS-продуктами.
Инструменты

Представляем operate.txt: спецификация в формате YAML для ИИ-агентов, взаимодействующих с SaaS-продуктами.

Разработчик создал operate.txt — файл YAML, размещенный по адресу yourdomain.com/operate.txt, который документирует детали экранов, состояния загрузки, необратимые действия и пошаговые пути для ИИ-агентов, использующих функции компьютерного взаимодействия. Спецификация решает такие проблемы, как вопросы Claude вроде 'это сломано?' во время законных экранов загрузки.

OpenClawRadar
Сервер MCP ExposureGuard добавляет сканирование безопасности доменов в Claude Desktop.
Инструменты

Сервер MCP ExposureGuard добавляет сканирование безопасности доменов в Claude Desktop.

Разработчик создал MCP-сервер для сканирования безопасности доменов с помощью Claude Code, предоставляющий четыре инструмента для проверки SPF, DMARC, SSL, заголовков безопасности, DNSSEC, открытых портов, MX и HTTPS. Сервер доступен через pip install exposureguard-mcp с бесплатным тарифом в 100 API-вызовов в день.

OpenClawRadar
Разработчик тестирует Apple Intelligence для задач с буфером обмена на устройстве.
Инструменты

Разработчик тестирует Apple Intelligence для задач с буфером обмена на устройстве.

Разработчик создал менеджер буфера обмена, используя фреймворк Foundation Models от Apple Intelligence, и обнаружил, что он подходит для повседневных задач, таких как краткие сводки и переписывание текста, но ограничен в работе с неоднозначным языком и детальными задачами.

OpenClawRadar