Клод Соннет 4.6 оценивает отчёты об ошибках от четырёх локальных моделей Qwen3.5.

✍️ OpenClawRadar📅 Опубликовано: 15 марта 2026 г.🔗 Source
Клод Соннет 4.6 оценивает отчёты об ошибках от четырёх локальных моделей Qwen3.5.
Ad

Тестирование локальных моделей для составления отчётов об ошибках

Разработчик, переходящий с Sonnet/Haiku на локальные модели на 32-гигабайтном MacBook Air M5, протестировал четыре варианта Qwen3.5 на способность составлять отчёты об ошибках. Используя LM Studio в качестве сервера и opencode CLI для вызова моделей, он попросил каждую модель изучить и составить отчёт об ошибке для проблемы в iOS-игре, где границы снаряжения не сбрасывают цвет должным образом после снятия предметов.

Протестированные модели

  • Tesslate/OmniCoder-9B-GGUF Q8_0
  • lmstudio-community/Qwen3.5-27B-GGUF Q4_K_M
  • Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF Q4_K_M
  • lmstudio-community/Qwen3.5-35B-A3B-GGUF Q4_K_M

Подтверждение ошибки

Основная ошибка подтверждена в исходных файлах. В EquipmentSlotNode.swift условие if let c = borderColor в методе setEquipment молча пропускает присваивание, когда передаётся nil. В EquipmentNode.swift метод updateEquipment(from:) передаёт borderColor: nil для пустых слотов, поэтому цвет границы никогда не сбрасывается. Документация к setEquipment гласит "передайте nil, чтобы сохранить текущий цвет" — документируя некорректное поведение как намеренный дизайн.

Ad

Оценки отчётов от Claude Sonnet 4.6

bug_report_9b_omnicoder — A−

Лучший из четырёх. Предлагает самое чистое и идиоматичное исправление на Swift: borderShape.strokeColor = borderColor ?? theme.textDisabledColor.skColor — одна строка, заменяющая блок if let без лишних ветвлений. Единственный отчёт, упоминающий дополнительные контекстные файлы (GameScene.swift, BackpackManager.swift), которые являются частью потока, вызывающего ошибку.

Недостаток: Как и все четыре отчёта, тестовый код не скомпилируется. borderShape объявлен как private let в EquipmentSlotNode — @testable import раскрывает только internal, но не private. Не упоминает, что комментарий в документации нуждается в обновлении.

bug_report_27b_lmstudiocommunity — B+

Точный диагноз. Предлагает чистое исправление с двумя ветвями: if id != nil { borderShape.strokeColor = borderColor ?? theme.textDisabledColor.skColor } else { borderShape.strokeColor = theme.textDisabledColor.skColor } — более многословно, чем нужно, но верно. Правильно определяет EquipmentNode.updateEquipment как вызывающий метод и включает предложение по интеграционному тестированию.

Недостаток: Предлагает тест в LogicTests/EquipmentNodeTests.swift — файл, который уже существует и покрывает EquipmentNode, а не EquipmentSlotNode. Та же проблема с доступом к private в тестовом коде.

bug_report_27b_jackrong — B−

Правильный диагноз, но самое слабое предложенное исправление. Добавляет сброс внутри блока else: borderShape.strokeColor = theme.textDisabledColor.skColor // Reset border on clear — технически верно для конкретного случая снятия снаряжения, но оставляет весь метод в запутанном состоянии. Сброс границы в блоке else может быть немедленно перезаписан блоком if let ниже, если кто-то передаст id: nil, borderColor: someColor. Исправление латает конкретный сбой, не устраняя избыточность.

Разработчик использовал параметры по умолчанию, кроме размера контекстного окна, чтобы уместить как можно больше в оперативной памяти, отметив, что некоторая настройка может дать улучшение. Он пробовал некоторые модели unsloth, но с ограниченным успехом.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Использование Claude в качестве креативного директора в процессе создания стикеров
Кейсы

Использование Claude в качестве креативного директора в процессе создания стикеров

Разработчик создал приложение для стикеров, в котором Claude анализирует загруженные пользователями фотографии, генерирует девять концепций стикеров и пишет подробные промпты для моделей генерации изображений, что приводит к созданию персонализированных стикеров вместо стандартных.

OpenClawRadar
Бенчмарк против продакшена: когда тесты ИИ-агентов проходят, а реальные рабочие процессы дают сбой
Кейсы

Бенчмарк против продакшена: когда тесты ИИ-агентов проходят, а реальные рабочие процессы дают сбой

Разработчик переключил производственные ИИ-агенты с Claude Sonnet на более дешёвые модели Grok и MiniMax после того, как они прошли бенчмарк-тесты, но обе модели провалились в продакшене из-за проблем с операционной надёжностью, которые не были охвачены бенчмарками.

OpenClawRadar
Разработчик выпускает игру в Steam с кодом от Claude: уроки по «виб-кодингу» против «виб-инжиниринга».
Кейсы

Разработчик выпускает игру в Steam с кодом от Claude: уроки по «виб-кодингу» против «виб-инжиниринга».

Разработчик выпустил Codex Mortis, игру в жанре bullet hell с тематикой некромантии на Steam, используя Claude Code для разработки с помощью ИИ. Проект потребовал двух полных переработок после первоначального прототипа, что подчеркивает разрыв между прототипом и готовым продуктом.

OpenClawRadar
Не-программист создал многопользовательскую игру в Steam с помощью Claude AI — 60 000 строк, 5 фракций, 87 способностей
Кейсы

Не-программист создал многопользовательскую игру в Steam с помощью Claude AI — 60 000 строк, 5 фракций, 87 способностей

Пользователь Reddit без опыта программирования создал полноценную многопользовательскую игру (60 тыс. строк, 5 фракций, 87 способностей) с помощью Claude AI и получил одобрение в Steam. Ранний доступ с 1 июня.

OpenClawRadar