Supra-50M-Reasoning: открытая малогабаритная модель с цепью логических рассуждений

✍️ OpenClawRadar📅 Опубликовано: 20 июня 2026 г.🔗 Source
Supra-50M-Reasoning: открытая малогабаритная модель с цепью логических рассуждений
Ad

SupraLabs выпустила Supra-50M-Reasoning (ThinkSupra-50M) — крошечную модель с 50M параметров, которая перед ответом генерирует полную цепочку рассуждений (CoT). Это вариант для рассуждений от Supra-50M-Instruct, дообученный на базе Supra-50M-Base с использованием синтетического набора данных из 500 примеров, сгенерированных Qwen3 1.7B, обученный в течение 6 эпох с SFT в bfloat16. Экспериментальная версия, склонна к галлюцинациям, полностью открыта.

Формат вывода

Каждый ответ следует этой структуре:

<|begin_of_thought|> ... рассуждение ... <|end_of_thought|> <|begin_of_solution|> ... окончательный ответ ... <|end_of_solution|>

Быстрый старт

import torch
from transformers import pipeline, AutoTokenizer

MODEL_ID = "SupraLabs/Supra-50M-Reasoning" tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, clean_up_tokenization_spaces=False) pipe = pipeline("text-generation", model=MODEL_ID, tokenizer=tokenizer, device_map="auto", torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32)

def build_prompt(instruction, input_text=""): if input_text.strip(): return f"Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{input_text}\n\n### Response:\n" return f"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:\n"

def generate(instruction, input_text=""): result = pipe(build_prompt(instruction, input_text), max_new_tokens=512, do_sample=True, temperature=0.3, top_k=50, top_p=0.9, repetition_penalty=1.15, pad_token_id=pipe.tokenizer.pad_token_id, eos_token_id=pipe.tokenizer.eos_token_id, return_full_text=False) return result[0]['generated_text'].strip()

Ad

Пример вывода

Промпт: "Что такое ИИ?"

Рассуждение: "Итак, пользователь спрашивает об ИИ. Давайте начну с того, что такое ИИ. ИИ — это подмножество машинного обучения, а именно нейронные сети..."

Ответ: "ИИ — это подмножество машинного обучения, которое позволяет машинам учиться на данных... используется в здравоохранении, финансах и даже в робототехнике."

Что дальше

SupraLabs планирует более крупные модели: Supra-124M (Base, Chat, Reasoning) и Supra-350M (Base, Chat, Reasoning, Coding).

Модель на Hugging Face: Supra-50M-Reasoning
Набор данных: SupraThink-Dataset-500x

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Обновление правила метаобучения DeepMind DiscoRL перенесено с JAX на PyTorch.
Инструменты

Обновление правила метаобучения DeepMind DiscoRL перенесено с JAX на PyTorch.

Разработчик перенёс правило метаобучения DiscoRL от DeepMind из JAX в PyTorch. Реализация включает репозиторий на GitHub с блокнотом Colab, API и весами, размещёнными на Hugging Face.

OpenClawRadar
Устранение неполадок с доступом к электронной почте и Google Drive для AI-агентов
Инструменты

Устранение неполадок с доступом к электронной почте и Google Drive для AI-агентов

Настройка доступа к электронной почте и Google Drive для ИИ-ботов на AWS может привести к блокировкам аккаунтов. Вот решение с использованием Gmail и доменов Workspace.

OpenClawRadar
Многомодельный совет по рабочим процессам для ИИ-агентов программирования
Инструменты

Многомодельный совет по рабочим процессам для ИИ-агентов программирования

Разработчик создал веб-инструмент, который выполняет задачи программирования через три модели ИИ — GPT-4o в роли архитектора, Claude в роли скептика и Gemini в роли синтезатора — перед передачей их агентам кодирования. Инструмент генерирует файл PLAN.md с явными ограничениями и требует от пользователей предоставления собственных API-ключей.

OpenClawRadar
Навык OpenClaw Video Translator доступен на ClawHub.
Инструменты

Навык OpenClaw Video Translator доступен на ClawHub.

Новый навык Video Translator для агентов OpenClaw позволяет пользователям загрузить видео или предоставить URL-ссылку, чтобы мгновенно получить переведённый превью. Навык размещён на ClawHub.

OpenClawRadar