OmniCoder-9B демонстрирует высокую производительность для агентного кодирования на системах с 8 ГБ видеопамяти.

✍️ OpenClawRadar📅 Опубликовано: 13 марта 2026 г.🔗 Source
OmniCoder-9B демонстрирует высокую производительность для агентного кодирования на системах с 8 ГБ видеопамяти.
Ad

Результаты тестирования производительности OmniCoder-9B с OpenCode

Пользователь на r/LocalLLaMA сообщил о тестировании OmniCoder-9B, дообученной версии Qwen3.5-9B, обученной на трейсах Opus, и обнаружил, что она хорошо справляется с агентными задачами программирования на системах с ограниченным объёмом видеопамяти. Модель доступна на Hugging Face по адресу Tesslate/OmniCoder-9B.

Техническая настройка и конфигурация

Пользователь запустил квантование Q4_K_M GGUF с помощью ik_llama следующей командой:

ik_llama.cpp\build\bin\Release\llama-server.exe -m models/Tesslate/OmniCoder-9B-GGUF/omnicoder-9b-q4_k_m.gguf -ngl 999 -fa 1 -b 2048 -ub 512 -t 8 -c 100000 -ctk f16 -ctv q4_0 --temp 0.4 --top-p 0.95 --top-k 20 --presence-penalty 0.0 --jinja --ctx-checkpoints 0

С такой конфигурацией была достигнута скорость примерно 40 токенов в секунду. Пользователь отметил, что квантование Q5_KS с длиной контекста 64 000 обеспечивает схожую скорость.

Ad

Конфигурация OpenCode

Конфигурация OpenCode, использованная для тестирования:

"local": { "models": { "/models/Tesslate/OmniCoder-9B-GGUF/omnicoder-9b-q4_k_m.gguf": { "interleaved": { "field": "reasoning_content" }, "limit": { "context": 100000, "output": 32000 }, "name": "omnicoder-9b-q4_k_m", "reasoning": true, "temperature": true, "tool_call": true } }, "npm": "@ai-sdk/openai-compatible", "options": { "baseURL": "http://localhost:8080/v1" } }

Пользователь упомянул о возможной ошибке, вызывающей полную переобработку промпта, которую он исследует.

Контекст и сравнение

Тестирование было мотивировано опасениями по поводу ограничений квот и изменений цен в коммерческих инструментах ИИ для программирования. Пользователь конкретно упомянул наличие 8 ГБ видеопамяти, что обычно ограничивает возможность запуска производительных моделей с открытым исходным кодом на хорошей скорости для агентного программирования. Он отметил, что хотя MOE-модели могут предлагать лучшую производительность, их скорость значительно ниже.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Skales Desktop AI Agent, созданный с использованием Claude, с маскотом в стиле Клиппи
Инструменты

Skales Desktop AI Agent, созданный с использованием Claude, с маскотом в стиле Клиппи

Skales — это настольный ИИ-агент, работающий локально на Windows и macOS, использующий Claude через API OpenRouter/Anthropic для рассуждений и выполнения инструментов. Включает плавающий талисман Desktop Buddy со скином в виде скрепки и может выполнять команды, такие как отправка писем, управление файлами, просмотр веб-страниц и управление календарями.

OpenClawRadar
Пястовские ворота: Открытый прокси-API для анонимизации данных LLM
Инструменты

Пястовские ворота: Открытый прокси-API для анонимизации данных LLM

Piast Gate — это API-прокси с открытым исходным кодом, который анонимизирует конфиденциальные данные перед отправкой запросов к LLM и восстанавливает исходные данные в ответах. Текущая MVP-версия поддерживает API Google Gemini, польский язык, локальное выполнение и может анонимизировать текст или документы Word без обработки LLM.

OpenClawRadar
Исследование Mistral Voxtral Realtime 4B на чистом C для преобразования речи в текст
Инструменты

Исследование Mistral Voxtral Realtime 4B на чистом C для преобразования речи в текст

Voxtral.c предлагает чистую C-реализацию модели распознавания речи Voxtral Realtime 4B от Mistral AI, устраняя зависимости, кроме стандартной библиотеки C.

OpenClawRadar
Выпущены пять бесплатных расширений для Claude Desktop: Inspector Lite, Graph Lite, Bible Code, Word Graph и Fun Pack
Инструменты

Выпущены пять бесплатных расширений для Claude Desktop: Inspector Lite, Graph Lite, Bible Code, Word Graph и Fun Pack

Разработчик опубликовал пять локальных расширений для Claude Desktop с открытым исходным кодом: Inspector Lite для семантического поиска по коду, Graph Lite для персональной графовой базы знаний, Fun Pack с развлекательными функциями, Word Graph для изучения Библии и Bible Code для обнаружения паттернов. Все работают локально без внешних зависимостей или дополнительных API-ключей.

OpenClawRadar