Supra-50M-Reasoning: открытый крошечный рассуждатель с CoT

SupraLabs выпустила Supra-50M-Reasoning (ThinkSupra-50M) — крошечную модель с 50M параметров, которая перед ответом генерирует полную цепочку рассуждений (CoT). Это вариант для рассуждений от Supra-50M-Instruct, дообученный на базе Supra-50M-Base с использованием синтетического набора данных из 500 примеров, сгенерированных Qwen3 1.7B, обученный в течение 6 эпох с SFT в bfloat16. Экспериментальная версия, склонна к галлюцинациям, полностью открыта.

Формат вывода

Каждый ответ следует этой структуре:

<|begin_of_thought|> ... рассуждение ... <|end_of_thought|> <|begin_of_solution|> ... окончательный ответ ... <|end_of_solution|>

Быстрый старт

import torch
from transformers import pipeline, AutoTokenizer

MODEL_ID = "SupraLabs/Supra-50M-Reasoning"
tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, clean_up_tokenization_spaces=False)
pipe = pipeline("text-generation", model=MODEL_ID, tokenizer=tokenizer, device_map="auto", torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32)
def build_prompt(instruction, input_text=""):
    if input_text.strip():
        return f"Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{input_text}\n\n### Response:\n"
    return f"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:\n"
def generate(instruction, input_text=""):
    result = pipe(build_prompt(instruction, input_text), max_new_tokens=512, do_sample=True, temperature=0.3, top_k=50, top_p=0.9, repetition_penalty=1.15, pad_token_id=pipe.tokenizer.pad_token_id, eos_token_id=pipe.tokenizer.eos_token_id, return_full_text=False)
    return result[0]['generated_text'].strip()

Пример вывода

Промпт: "Что такое ИИ?"

Рассуждение: "Итак, пользователь спрашивает об ИИ. Давайте начну с того, что такое ИИ. ИИ — это подмножество машинного обучения, а именно нейронные сети..."

Ответ: "ИИ — это подмножество машинного обучения, которое позволяет машинам учиться на данных... используется в здравоохранении, финансах и даже в робототехнике."

Что дальше

SupraLabs планирует более крупные модели: Supra-124M (Base, Chat, Reasoning) и Supra-350M (Base, Chat, Reasoning, Coding).

Модель на Hugging Face: Supra-50M-Reasoning
Набор данных: SupraThink-Dataset-500x

📖 Читать полный источник: r/LocalLLaMA

Supra-50M-Reasoning: открытая малогабаритная модель с цепью логических рассуждений

Формат вывода

Быстрый старт

Пример вывода

Что дальше

👀 Смотрите также

Обновление правила метаобучения DeepMind DiscoRL перенесено с JAX на PyTorch.

Устранение неполадок с доступом к электронной почте и Google Drive для AI-агентов

Многомодельный совет по рабочим процессам для ИИ-агентов программирования

Навык OpenClaw Video Translator доступен на ClawHub.