Supra-50M-Reasoning: открытая малогабаритная модель с цепью логических рассуждений

SupraLabs выпустила Supra-50M-Reasoning (ThinkSupra-50M) — крошечную модель с 50M параметров, которая перед ответом генерирует полную цепочку рассуждений (CoT). Это вариант для рассуждений от Supra-50M-Instruct, дообученный на базе Supra-50M-Base с использованием синтетического набора данных из 500 примеров, сгенерированных Qwen3 1.7B, обученный в течение 6 эпох с SFT в bfloat16. Экспериментальная версия, склонна к галлюцинациям, полностью открыта.
Формат вывода
Каждый ответ следует этой структуре:
<|begin_of_thought|> ... рассуждение ... <|end_of_thought|> <|begin_of_solution|> ... окончательный ответ ... <|end_of_solution|>
Быстрый старт
import torch from transformers import pipeline, AutoTokenizerMODEL_ID = "SupraLabs/Supra-50M-Reasoning" tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, clean_up_tokenization_spaces=False) pipe = pipeline("text-generation", model=MODEL_ID, tokenizer=tokenizer, device_map="auto", torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32)
def build_prompt(instruction, input_text=""): if input_text.strip(): return f"Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{input_text}\n\n### Response:\n" return f"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:\n"
def generate(instruction, input_text=""): result = pipe(build_prompt(instruction, input_text), max_new_tokens=512, do_sample=True, temperature=0.3, top_k=50, top_p=0.9, repetition_penalty=1.15, pad_token_id=pipe.tokenizer.pad_token_id, eos_token_id=pipe.tokenizer.eos_token_id, return_full_text=False) return result[0]['generated_text'].strip()
Пример вывода
Промпт: "Что такое ИИ?"
Рассуждение: "Итак, пользователь спрашивает об ИИ. Давайте начну с того, что такое ИИ. ИИ — это подмножество машинного обучения, а именно нейронные сети..."
Ответ: "ИИ — это подмножество машинного обучения, которое позволяет машинам учиться на данных... используется в здравоохранении, финансах и даже в робототехнике."
Что дальше
SupraLabs планирует более крупные модели: Supra-124M (Base, Chat, Reasoning) и Supra-350M (Base, Chat, Reasoning, Coding).
Модель на Hugging Face: Supra-50M-Reasoning
Набор данных: SupraThink-Dataset-500x
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Обновление правила метаобучения DeepMind DiscoRL перенесено с JAX на PyTorch.
Разработчик перенёс правило метаобучения DiscoRL от DeepMind из JAX в PyTorch. Реализация включает репозиторий на GitHub с блокнотом Colab, API и весами, размещёнными на Hugging Face.

Устранение неполадок с доступом к электронной почте и Google Drive для AI-агентов
Настройка доступа к электронной почте и Google Drive для ИИ-ботов на AWS может привести к блокировкам аккаунтов. Вот решение с использованием Gmail и доменов Workspace.

Многомодельный совет по рабочим процессам для ИИ-агентов программирования
Разработчик создал веб-инструмент, который выполняет задачи программирования через три модели ИИ — GPT-4o в роли архитектора, Claude в роли скептика и Gemini в роли синтезатора — перед передачей их агентам кодирования. Инструмент генерирует файл PLAN.md с явными ограничениями и требует от пользователей предоставления собственных API-ключей.

Навык OpenClaw Video Translator доступен на ClawHub.
Новый навык Video Translator для агентов OpenClaw позволяет пользователям загрузить видео или предоставить URL-ссылку, чтобы мгновенно получить переведённый превью. Навык размещён на ClawHub.