GuppyLM: 9-миллионная языковая модель, созданная с нуля для образовательных целей

✍️ OpenClawRadar📅 Опубликовано: 16 апреля 2026 г.🔗 Source

Что такое GuppyLM

GuppyLM — это крошечная языковая модель (примерно 9 миллионов параметров), которая притворяется рыбкой по имени Гуппи. Она создана с нуля, чтобы показать, как работают языковые модели, не требуя докторской степени или огромного кластера GPU. Проект включает генерацию данных, создание токенизатора, архитектуру модели, цикл обучения и вывод — всё примерно в 130 строках кода на PyTorch.

Детали архитектуры

Параметры: 8.7 млн
Слои: 6
Скрытая размерность: 384
Головы внимания: 6
FFN: 768 (ReLU)
Словарь: 4 096 (BPE)
Максимальная последовательность: 128 токенов
Нормализация: LayerNorm
Позиции: Обучаемые эмбеддинги
LM head: Веса связаны с эмбеддингами

Это стандартный трансформер без GQA, RoPE, SwiGLU или раннего выхода — максимально простой.

Обучение и данные

Модель обучается на 60 тысячах синтетических диалогов по 60 темам примерно за 5 минут на бесплатном GPU T4 в Colab. Датасет (arman-bd/guppylm-60k-generic на HuggingFace) содержит 57 тысяч обучающих и 3 тысячи тестовых примеров в формате: {"input": "...", "output": "...", "category": "..."}.

Темы включают: приветствия, чувства, температура, еда, свет, вода, аквариум, шум, ночь, одиночество, пузыри, стекло, отражение, дыхание, плавание, цвета, вкус, растения, фильтр, водоросли, улитки, страх, возбуждение, скука, любопытство, счастье, усталость, снаружи, кошки, дождь, времена года, музыка, посетители, дети, смысл жизни, время, память, сны, размер, будущее, прошлое, имя, погода, сон, друзья, шутки, страх, любовь, возраст, интеллект, здоровье, пение, телевизор и другие.

Личность и вывод

Гуппи говорит короткими предложениями в нижнем регистре о воде, температуре, свете, вибрациях и еде. Она не понимает человеческих абстракций вроде денег, телефонов или политики. Пример диалога:

Вы> привет, гуппи
Гуппи> привет. я только что нашёл хорошее место у камня. температура приятная.
Вы> ты голоден
Гуппи> да. всегда да. я поплыву наверх прямо сейчас. обещаю съесть всё.
Вы> в чём смысл жизни
Гуппи> еда. ответ всегда еда.

Быстрый старт

Поговорить с Гуппи (обучение не требуется): Загружает предобученную модель с HuggingFace. Просто запустите все ячейки в блокноте.

Обучить свою: Установите среду выполнения на GPU T4, запустите все ячейки — загрузит датасет, обучит токенизатор, обучит модель, протестирует её. Загрузите на HuggingFace или скачайте локально.

Локальный чат:

pip install torch tokenizers
python -m guppylm chat

Пример локального взаимодействия:

Вы> кот смотрит на тебя
Гуппи> я прячусь за растением, когда пушистый приходит.
Вы> на улице идёт дождь
Гуппи> я думаю, дождь — это лучшее, что есть снаружи.

Структура проекта

guppylm/
├── config.py          # Гиперпараметры (модель + обучение)
├── model.py           # Стандартный трансформер
├── dataset.py         # Загрузка данных + батчинг
├── train.py           # Цикл обучения (косинусный LR, AMP)
├── generate_data.py   # Генератор диалоговых данных (60 тем)
├── eval_cases.py      # Тестовые случаи
├── prepare_data.py    # Подготовка данных + обучение токенизатора
└── inference.py       # Интерфейс чата

Этот проект полезен разработчикам, которые хотят понять основы архитектуры трансформеров, не имея дела с моделями на миллиарды параметров. Полная реализация показывает каждый этап от сырого текста до обученных весов и сгенерированного вывода.

📖 Read the full source: HN LLM Tools

👀 Смотрите также

Инструменты

T9OS: Система оркестрации ИИ, полностью созданная с помощью кода Claude

Студент-экономист создал T9OS, полноценный слой оркестрации ИИ, используя Claude Code в качестве единственного инструмента программирования. Система включает 18 производственных конвейеров, 12-стадийный движок жизненного цикла и 7 ИИ-«Стражей», которые проверяют каждый вывод.

26 мар. 2026 г., 12:45 UTC

OpenClawRadar

Инструменты

yoyo: Локальный MCP-сервер для безопасного чтения кодовой базы и защищённой записи с помощью Claude Code

yoyo — это локальный MCP-сервер с открытым исходным кодом, который предоставляет кодирующим агентам, таким как Claude Code, обоснованное чтение репозиториев и защищённую запись для 16 языков, включая Rust, Go, Python и TypeScript. Он предотвращает незаметное внесение ошибочных изменений, возвращая машиночитаемый вывод guard_failure и включая retry_plan для целенаправленного исправления.

15 мар. 2026 г., 17:45 UTC

OpenClawRadar

Инструменты

Разработчик делится более чем 10 MCP-серверами для поселения AI-агентов, репутации и микроплатежей.

Разработчик создал BlindOracle на Claude Code с более чем 100 агентами и разработал 10+ MCP-серверов для расчетов, репутации и микроплатежей. Архитектура включает приватные прогнозы с коммитом-раскрытием, ончейн-оценку, микроплатежи по запросу и верифицируемую аттестацию агентов.

9 мар. 2026 г., 11:45 UTC

OpenClawRadar

Инструменты

Два инструмента MCP для Claude Code: Проверка идей и Память торгового агента

Разработчик создал два инструмента MCP для Claude Code: idea-reality-mcp проверяет GitHub и Hacker News перед началом программирования, чтобы избежать дублирования, а tradememory-protocol предоставляет память для торговых ИИ-агентов, позволяя сохранять сделки с контекстом и отслеживать эффективность стратегий. Оба инструмента имеют открытый исходный код и доступны на PyPI.

16 апр. 2026 г., 17:45 UTC

OpenClawRadar