Supra-50M-Raciocínio: Modelo Tiny de Código Aberto com Pensamento em Cadeia de Raciocínio

A SupraLabs lançou o Supra-50M-Reasoning (ThinkSupra-50M), um minúsculo modelo de 50M de parâmetros que gera uma cadeia de pensamento (CoT) completa antes de responder. É a variante de raciocínio do Supra-50M-Instruct, ajustado a partir do Supra-50M-Base usando um dataset sintético de 500 exemplos gerados pelo Qwen3 1.7B, treinado por 6 épocas com SFT em bfloat16. Experimental, propenso a alucinações e totalmente aberto.
Formato de Inferência
Cada resposta segue esta estrutura:
<|begin_of_thought|> ... pensamento ... <|end_of_thought|> <|begin_of_solution|> ... resposta final ... <|end_of_solution|>
Início Rápido
import torch from transformers import pipeline, AutoTokenizerMODEL_ID = "SupraLabs/Supra-50M-Reasoning" tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, clean_up_tokenization_spaces=False) pipe = pipeline("text-generation", model=MODEL_ID, tokenizer=tokenizer, device_map="auto", torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32)
def build_prompt(instruction, input_text=""): if input_text.strip(): return f"Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{input_text}\n\n### Response:\n" return f"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:\n"
def generate(instruction, input_text=""): result = pipe(build_prompt(instruction, input_text), max_new_tokens=512, do_sample=True, temperature=0.3, top_k=50, top_p=0.9, repetition_penalty=1.15, pad_token_id=pipe.tokenizer.pad_token_id, eos_token_id=pipe.tokenizer.eos_token_id, return_full_text=False) return result[0]['generated_text'].strip()
Exemplo de Saída
Prompt: "O que é IA?"
Pensamento: "Ok, o usuário está perguntando sobre IA. Deixe-me começar lembrando o que é IA. IA é um subconjunto do aprendizado de máquina, especificamente redes neurais..."
Resposta: "IA é um subconjunto do aprendizado de máquina que foca em capacitar máquinas a aprender com dados... usado em saúde, finanças e até mesmo na área de robótica."
Próximos Passos
A SupraLabs planeja modelos maiores: Supra-124M (Base, Chat, Raciocínio) e Supra-350M (Base, Chat, Raciocínio, Codificação).
Modelo no Hugging Face: Supra-50M-Reasoning
Dataset: SupraThink-Dataset-500x
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

ExposureGuard MCP Server Adiciona Varredura de Segurança de Domínio ao Claude Desktop
Um desenvolvedor criou um servidor MCP para verificação de segurança de domínios usando o Claude Code, expondo quatro ferramentas que verificam SPF, DMARC, SSL, cabeçalhos de segurança, DNSSEC, portas abertas, MX e HTTPS. O servidor está disponível via pip install exposureguard-mcp com um plano gratuito de 100 chamadas de API por dia.

Meu OpenClaw Ganhou um Corpo Físico: Cão Robótico com Olhos, Pernas e Voz
Nenhum

Painel local monitora o uso do Claude Code com custos de tokens, chamadas de ferramentas e análises de sessão
Um desenvolvedor criou um painel local que lê os arquivos de sessão JSONL do Claude Code para visualizar o uso de tokens, custos estimados, detalhamento de chamadas de ferramentas e histórico de sessões. A ferramenta funciona inteiramente na sua máquina com uma API Express e um painel React.

O plugin de código Claude de código aberto captura livros e os converte em Markdown estruturado.
Um desenvolvedor disponibilizou como código aberto um plugin do Claude Code que captura automaticamente páginas de livros via capturas de tela, realiza OCR com o macOS Vision e gera arquivos Markdown estruturados organizados por tema em vez de ordem de capítulos. A ferramenta suporta Kindle, Apple Books, Kindle Cloud Reader e PDFs digitalizados no macOS.