Модель Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2 выпущена с конфигурацией для LM Studio

Детали модели и доступность
Модель Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-Q4_K_M-GGUF теперь доступна на HuggingFace. Эта модель была создана путём слияния двух существующих моделей: Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF от Jackrong и Qwen3.5-9B-Uncensored-HauhauCS-Aggressive от HauhauCS.
Слияние сохраняет все обучающие данные и поддерживает точность на архитектуре Qwen 3.5 9B с использованием точности Float32 в процессе объединения. Модель обучена на наборе данных Claude Opus 4.6, доступном по адресу https://huggingface.co/datasets/Roman1111111/claude-opus-4.6-10000x.
Рекомендуемая конфигурация
Для наилучшей производительности в LM Studio 0.4.7 (сборка 4) используйте следующие настройки:
- Системный промпт: https://pastebin.com/pU25DVnB
- Температура: 0.7
- Выборка Top K: 20
- Штраф за повторение: (отключён) или 1.0
- Штраф за присутствие: 1.5
- Выборка Top P: 0.8
- Выборка Min P: 0.0
- Сид: 3407
Производительность и оборудование
На RTX 3060 модель достигает 42 токенов в секунду в LM Studio. Создатель отмечает, что она может работать ещё быстрее на llama-server. Модель была создана в ответ на запросы пользователей Reddit и HuggingFace, которые хотели получить большой контекст в нецензурированном умном локальном ИИ без необходимости в мощных GPU.
Модель доступна по адресу: https://huggingface.co/LuffyTheFox/Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-GGUF
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Расширение Compass для Chrome добавляет инструменты навигации в Claude и ChatGPT
Разработчик создал бесплатное расширение для Chrome под названием Compass, которое добавляет мини-карту промптов, фиксированные заголовки при прокрутке, контрольные списки сессий и шаблоны для создания промптов в интерфейсы Claude и ChatGPT, чтобы решить проблемы навигации в длинных диалогах.

FOMOE позволяет запускать вывод модели Qwen3.5 на 397 миллиардов параметров на настольном оборудовании стоимостью $2100.
FOMOE (Fast Opportunistic Mixture of Experts) позволяет запускать флагманскую модель Qwen3.5 с 397 миллиардами параметров со скоростью 5-9 токенов/сек на потребительском оборудовании с использованием двух видеокарт за $500, 32 ГБ ОЗУ и накопителя NVMe с квантованием Q4_K_M.

Расширение для Chrome "Claude to PDF" экспортирует длинные беседы с сохранением форматирования.
Разработчик выпустил бесплатное расширение для Chrome под названием Claude to PDF, которое захватывает полную историю переписки из чатов Claude AI и сохраняет блоки кода, математические формулы LaTeX и форматирование таблиц при экспорте в PDF.

Jan-Code-4B: Облегченная модель, настроенная для работы с кодом, предназначенная для локальной разработки
Команда Jan выпустила Jan-Code-4B — модель с 4 миллиардами параметров, настроенную для работы с кодом, на основе Jan-v3-4B-base-instruct. Она предназначена как прямая замена модели Haiku в Claude Code, предлагая улучшенную помощь в программировании при локальном запуске.