Modelo Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2 Lançado com Configuração LM Studio

Detalhes e Disponibilidade do Modelo
O modelo Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-Q4_K_M-GGUF está agora disponível no HuggingFace. Este modelo foi criado pela fusão de dois modelos existentes: o Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF de Jackrong e o Qwen3.5-9B-Uncensored-HauhauCS-Aggressive de HauhauCS.
A fusão preserva todos os dados de treinamento e mantém a precisão na arquitetura Qwen 3.5 9B usando precisão Float32 durante o processo de mesclagem. O modelo é treinado no conjunto de dados Claude Opus 4.6 disponível em https://huggingface.co/datasets/Roman1111111/claude-opus-4.6-10000x.
Configuração Recomendada
Para melhor desempenho no LM Studio 0.4.7 (build 4), use estas configurações:
- Prompt do Sistema: https://pastebin.com/pU25DVnB
- Temperatura: 0.7
- Amostragem Top K: 20
- Penalidade de Repetição: (desativada) ou 1.0
- Penalidade de Presença: 1.5
- Amostragem Top P: 0.8
- Amostragem Min P: 0.0
- Seed: 3407
Desempenho e Hardware
Em uma RTX 3060, o modelo alcança 42 tokens por segundo no LM Studio. O criador observa que pode rodar ainda mais rápido no llama-server. O modelo foi criado em resposta a pedidos de usuários no Reddit e HuggingFace que desejavam uma janela de contexto grande em IA local inteligente não censurada sem exigir GPUs poderosas.
O modelo está disponível em: https://huggingface.co/LuffyTheFox/Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-GGUF
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

iai-mcp: Daemon local oferece ao Claude memória persistente entre sessões com 99% de recall
iai-mcp é um daemon local de código aberto que captura cada conversa do Claude, organiza em três níveis de memória e fornece contexto de volta em novas sessões. Obtém recall verbatim >99%, recuperação em menos de 100ms e custo de início de sessão inferior a 3.000 tokens.

Orquestrador de fluxo de trabalho com integração CLI de IA para tarefas de sysadmin
Um desenvolvedor criou um orquestrador de fluxos de trabalho baseado em arquivos chamado 'workflow' que se integra com Claude Code, Codex CLI e Gemini CLI. Ele gera, atualiza, corrige e refina fluxos de trabalho YAML a partir de descrições em linguagem natural para tarefas de administração de sistemas.

SkyClaw: Runtime de Agente de IA Rust para VPS na Nuvem com Controle via Telegram
SkyClaw é um runtime de agente de IA baseado em Rust de 6,9 MB projetado para implantação em VPS na nuvem com o Telegram como única interface. Ele executa comandos shell, navega na web via Chrome headless, lê/escreve arquivos e busca URLs com encadeamento de ferramentas em múltiplas rodadas.

Imprimir Folha de Dicas de Código Claude com Atualizações Automáticas Semanais
Um desenvolvedor criou uma folha de dicas imprimível de uma página para o Claude Code usando o próprio Claude, cobrindo atalhos de teclado, comandos de barra, fluxos de trabalho, sistema de habilidades, memória/CLAUDE.md, configuração MCP, sinalizadores CLI e arquivos de configuração. O arquivo HTML é atualizado automaticamente semanalmente via cron job com novos recursos marcados como 'NOVO'.