Обзор производительности Omnicoder-9B: Скорость против проблем с вызовом инструментов

✍️ OpenClawRadar📅 Опубликовано: 18 апреля 2026 г.🔗 Source

Технический обзор

Omnicoder-9B — это модель, специализированная на программировании, разработанная Tesslate на основе архитектуры Qwen 3.5. Она дообучена поверх Qwen3.5 9B с использованием выводов нескольких моделей, включая Opus 4.6, GPT 5.4, GPT 5.3 Codex и Gemini 3.1 Pro.

Характеристики производительности

Модель демонстрирует высокую производительность на оборудовании среднего уровня. При 12 ГБ видеопамяти пользователи сообщают о стабильной генерации токенов со скоростью 15 токенов/сек даже при размере контекста в 100 тыс. Обработка промптов заметно быстрая — примерно 265 токенов/сек. Модель работает без сбоев системы или ухудшения производительности.

Ограничения и проблемы

Несмотря на преимущества в скорости, Omnicoder-9B показывает несколько ограничений в практических сценариях программирования:

Не удалось сгенерировать полный клон Super Mario в отдельном HTML-файле с помощью однократного промпта
Возникали сбои при вызове инструментов с серверами MCP, генерируя ошибки MCP во время получения данных
Проблемы с выполнением вызовов инструментов записи из Claude Code, хотя это может быть связано с факторами совместимости

Тестирование интеграции с IDE

Тестирование в средах разработки показало неоднозначные результаты:

В LM Studio с Roo Code: происходили разрывы соединения при увеличении размера токенов до 4 тыс., хотя это, по-видимому, проблема интеграции, а не самой модели
Модель успешно обновляла или записывала небольшие скрипты с размером токенов от 2 до 3 тыс.
API-запросы завершались неудачей для токенов свыше 4 тыс. без сообщений об ошибках
В Claude Code: генерация токенов ощущалась медленнее по сравнению с Roo Code, и модель не смогла выполнить вызовы инструментов записи после генерации вывода

Пользователь отмечает, что Roo Code оказался наиболее эффективным расширением для локальных LLM среди протестированных вариантов, включая Continue.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

Tether: MCP-сервер для обмена контекстом между ИИ-моделями через SQLite

Tether — это инструмент с открытым исходным кодом, который сворачивает JSON-данные в 28-байтовые контентно-адресуемые дескрипторы, позволяя нескольким ИИ-моделям обмениваться контекстом через общую базу данных SQLite. Он функционирует как сервер MCP, обеспечивая прямую коммуникацию между моделями, такими как Claude и MiniMax, без необходимости копирования и вставки.

1 мар. 2026 г., 13:45 UTC

OpenClawRadar

Инструменты

Реляционная память для LLM: Трехуровневая система моделирует взаимоотношения с пользователем

Инструмент с открытым исходным кодом на Python, который добавляет реляционную память к LLM, моделируя отношения пользователь-ИИ по семи психологическим измерениям, используя трёхуровневую нарративную структуру вместо плоского хранения фактов.

14 мар. 2026 г., 13:45 UTC

OpenClawRadar

Инструменты

Плагин ByteRover Memory для OpenClaw: Нативная интеграция с семантической иерархией

Плагин ByteRover Memory для OpenClaw обеспечивает нативную, структурированную долговременную память через трёхуровневую архитектуру и семантическую иерархию, хранящуюся в файлах Markdown. Он достигает 92,2% точности извлечения и требует OpenClaw v2026.3.22+.

25 мар. 2026 г., 14:45 UTC

OpenClawRadar

Инструменты

ApexClaw: Открытый ИИ-агент для Telegram с более чем 85 инструментами для веб-автоматизации, работы с голосом и электронной почтой

ApexClaw — это открытый AI-агент для Telegram, написанный на Go, который предоставляет более 85 встроенных инструментов, включая веб-сёрфинг с использованием headless Chrome, обработку голосовых сообщений, интеграцию с Gmail и выполнение shell-скриптов. Он предназначен для самостоятельного развёртывания и использует движок z.ai для принятия решений.

26 февр. 2026 г., 09:45 UTC

OpenClawRadar