Supra-50M-Reasoning: Raciocinador Tiny Open-Source com CoT

A SupraLabs lançou o Supra-50M-Reasoning (ThinkSupra-50M), um minúsculo modelo de 50M de parâmetros que gera uma cadeia de pensamento (CoT) completa antes de responder. É a variante de raciocínio do Supra-50M-Instruct, ajustado a partir do Supra-50M-Base usando um dataset sintético de 500 exemplos gerados pelo Qwen3 1.7B, treinado por 6 épocas com SFT em bfloat16. Experimental, propenso a alucinações e totalmente aberto.

Formato de Inferência

Cada resposta segue esta estrutura:

<|begin_of_thought|> ... pensamento ... <|end_of_thought|> <|begin_of_solution|> ... resposta final ... <|end_of_solution|>

Início Rápido

import torch
from transformers import pipeline, AutoTokenizer

MODEL_ID = "SupraLabs/Supra-50M-Reasoning"
tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, clean_up_tokenization_spaces=False)
pipe = pipeline("text-generation", model=MODEL_ID, tokenizer=tokenizer, device_map="auto", torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32)
def build_prompt(instruction, input_text=""):
    if input_text.strip():
        return f"Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{input_text}\n\n### Response:\n"
    return f"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:\n"
def generate(instruction, input_text=""):
    result = pipe(build_prompt(instruction, input_text), max_new_tokens=512, do_sample=True, temperature=0.3, top_k=50, top_p=0.9, repetition_penalty=1.15, pad_token_id=pipe.tokenizer.pad_token_id, eos_token_id=pipe.tokenizer.eos_token_id, return_full_text=False)
    return result[0]['generated_text'].strip()

Exemplo de Saída

Prompt: "O que é IA?"

Pensamento: "Ok, o usuário está perguntando sobre IA. Deixe-me começar lembrando o que é IA. IA é um subconjunto do aprendizado de máquina, especificamente redes neurais..."

Resposta: "IA é um subconjunto do aprendizado de máquina que foca em capacitar máquinas a aprender com dados... usado em saúde, finanças e até mesmo na área de robótica."

Próximos Passos

A SupraLabs planeja modelos maiores: Supra-124M (Base, Chat, Raciocínio) e Supra-350M (Base, Chat, Raciocínio, Codificação).

Modelo no Hugging Face: Supra-50M-Reasoning
Dataset: SupraThink-Dataset-500x

📖 Leia a fonte completa: r/LocalLLaMA

Supra-50M-Raciocínio: Modelo Tiny de Código Aberto com Pensamento em Cadeia de Raciocínio

Formato de Inferência

Início Rápido

Exemplo de Saída

Próximos Passos

👀 See Also

ExposureGuard MCP Server Adiciona Varredura de Segurança de Domínio ao Claude Desktop

Meu OpenClaw Ganhou um Corpo Físico: Cão Robótico com Olhos, Pernas e Voz

Painel local monitora o uso do Claude Code com custos de tokens, chamadas de ferramentas e análises de sessão

O plugin de código Claude de código aberto captura livros e os converte em Markdown estruturado.