Стальной человек R5: Дообученная модель на 14 миллиардов параметров превосходит Claude Opus в генерации кода Ada.

✍️ OpenClawRadar📅 Опубликовано: 13 марта 2026 г.🔗 Source
Стальной человек R5: Дообученная модель на 14 миллиардов параметров превосходит Claude Opus в генерации кода Ada.
Ad

Детали модели и обучения

Модель Steelman R5 — это дообученная версия Qwen2.5-Coder-14B-Instruct, специально оптимизированная для генерации кода на Ada. Обучение проводилось с помощью QLoRA 4-битного квантования через Unsloth с использованием TRL SFTTrainer на наборе из 3 430 пар инструкций Ada/SPARK, где каждый пример обучения успешно компилируется командой gnatmake -gnat2022 -gnatwa.

Конфигурация обучения: ранг LoRA 32, альфа 64, нацелена на проекции q/k/v/o/gate/up/down. Модель полностью переобучалась с нуля в каждом раунде на накопленном наборе данных (продолжение адаптера вызывало катастрофическое забывание на R2). Обучение длилось 1 эпоху со скоростью обучения 2e-5, постоянным расписанием, занимая около 49 минут за раунд на арендованном H100. Всего пять раундов (R1–R5), причём R2 был отброшен.

Результаты тестирования

Пользовательский тест компиляции Ada (1 000 промптов, первая попытка чистой компиляции):

  • Steelman R5 (14B): 68,6% успешных компиляций
  • Claude Opus 4.6: 42,1% успешных компиляций
  • Claude Sonnet 4.6: 37,2% успешных компиляций
  • Qwen2.5-Coder-14B (базовая, без дообучения): ~35% успешных компиляций
  • Claude Sonnet 4: 27,5% успешных компиляций

MultiPL-E HumanEval-Ada (157 задач, pass@1):

  • Steelman R5: 47,1% pass@1, 74,5% успешных компиляций
  • Qwen2.5-Coder-14B (базовая): 34,4% pass@1, 51,0% успешных компиляций

Это первые опубликованные результаты pass@1 для Ada на HumanEval для любой открытой модели.

Ad

Использование и доступность

Запустите модель командой: ollama run hf.co/the-clanker-lover/steelman-14b-ada-v0.1-GGUF

Версия GGUF занимает 12 ГБ видеопамяти при квантовании Q4_K_M.

Ограничения

  • Компиляция ≠ корректность: 68,6% компилируется, но только 47,1% даёт правильный вывод на HumanEval
  • Способность исправлять ошибки слабая (5,1%) — не ожидайте, что модель будет отлаживать код на Ada
  • Контракты SPARK компилируются, но не проверяются с помощью gnatprove
  • Синтетически сгенерированные данные обучения — ни один разработчик на Ada не писал эти примеры
  • Размер модели 14B означает, что она может упускать то, что заметила бы более крупная модель

Ресурсы

  • Модель: https://huggingface.co/the-clanker-lover/steelman-14b-ada-v0.1
  • GGUF: https://huggingface.co/the-clanker-lover/steelman-14b-ada-v0.1-GGUF
  • Набор данных: https://huggingface.co/datasets/the-clanker-lover/steelman-sft-ada

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

VibeAround: Локальный демон подключает агентов программирования к Telegram и Discord
Инструменты

VibeAround: Локальный демон подключает агентов программирования к Telegram и Discord

VibeAround — это локальный демон, который подключает кодирующие агенты, такие как Claude Code, Gemini CLI и Codex, к платформам мгновенных сообщений, включая Telegram и Discord. Инструмент поддерживает передачу сессий с кодами для продолжения бесед на разных устройствах.

OpenClawRadar
Clawpage: Инструмент для преобразования диалогов OpenClaw в статические веб-сайты
Инструменты

Clawpage: Инструмент для преобразования диалогов OpenClaw в статические веб-сайты

Разработчик создал Clawpage — инструмент, который преобразует историю сессий OpenClaw в статические веб-страницы для сохранения ценных бесед, включая обсуждения, исследования и процесс отладки. Инструмент доступен на GitHub.

OpenClawRadar
С навыками Claude Code с открытым исходным кодом: конвейер /do, сокративший повторные обращения на 80%
Инструменты

С навыками Claude Code с открытым исходным кодом: конвейер /do, сокративший повторные обращения на 80%

Разработчик выложил в открытый доступ 15 навыков Claude Code, созданных в ходе 100+ фриланс-проектов. Команда /do выполняет 5-этапный конвейер (/todo → /dev → /verify-dev → /build → /test → push) с циклами автоисправления, что обеспечивает на 80% меньше уточняющих запросов и на 60–65% лучшее качество кода в более чем 2000 коммитов.

OpenClawRadar
Преттиклоу: Более легкая альтернатива Опенклоу с быстрой настройкой
Инструменты

Преттиклоу: Более легкая альтернатива Опенклоу с быстрой настройкой

Pretticlaw — это легковесная альтернатива OpenClaw, для установки которой требуется всего 2 команды, занимает около 30 МБ, отвечает за 2–3 секунды и имеет встроенную панель управления на порту 6767.

OpenClawRadar