GuppyLM: Ein 9-Millionen-Parameter-LLM, das zu Bildungszwecken von Grund auf entwickelt wurde

✍️ OpenClawRadar📅 Veröffentlicht: 16. April 2026🔗 Source
GuppyLM: Ein 9-Millionen-Parameter-LLM, das zu Bildungszwecken von Grund auf entwickelt wurde
Ad

Was GuppyLM ist

GuppyLM ist ein winziges Sprachmodell (~9M Parameter), das vorgibt, ein Fisch namens Guppy zu sein. Es wurde von Grund auf gebaut, um zu zeigen, wie Sprachmodelle funktionieren, ohne dass ein Doktortitel oder ein riesiger GPU-Cluster erforderlich ist. Das Projekt umfasst Datengenerierung, Tokenizer-Erstellung, Modellarchitektur, Trainingsschleife und Inferenz – alles in etwa 130 Zeilen PyTorch-Code.

Architekturdetails

  • Parameter: 8,7M
  • Schichten: 6
  • Versteckte Dimension: 384
  • Köpfe: 6
  • FFN: 768 (ReLU)
  • Vokabular: 4.096 (BPE)
  • Maximale Sequenz: 128 Token
  • Norm: LayerNorm
  • Position: Gelernte Einbettungen
  • LM-Kopf: Gewichtsgebunden mit Einbettungen

Dies ist ein einfacher Transformer ohne GQA, RoPE, SwiGLU oder frühes Beenden – so einfach wie möglich.

Training und Daten

Das Modell trainiert auf 60K synthetischen Gesprächen über 60 Themen in etwa 5 Minuten auf einer kostenlosen Colab T4 GPU. Der Datensatz (arman-bd/guppylm-60k-generic auf HuggingFace) enthält 57K Trainings- und 3K Testbeispiele im Format: {"input": "...", "output": "...", "category": "..."}.

Themen umfassen: Begrüßungen, Gefühle, Temperatur, Futter, Licht, Wasser, Aquarium, Lärm, Nacht, Einsamkeit, Blasen, Glas, Spiegelung, Atmung, Schwimmen, Farben, Geschmack, Pflanzen, Filter, Algen, Schnecken, Angst, Aufregung, Langeweile, Neugier, Glück, Müdigkeit, Draußen, Katzen, Regen, Jahreszeiten, Musik, Besucher, Kinder, Sinn des Lebens, Zeit, Erinnerung, Träume, Größe, Zukunft, Vergangenheit, Name, Wetter, Schlaf, Freunde, Witze, Furcht, Liebe, Alter, Intelligenz, Gesundheit, Singen, Fernsehen und mehr.

Ad

Persönlichkeit und Ausgabe

Guppy spricht in kurzen, kleingeschriebenen Sätzen über Wasser, Temperatur, Licht, Vibrationen und Futter. Es versteht keine menschlichen Abstraktionen wie Geld, Telefone oder Politik. Beispielgespräch:

Du> hallo guppy
Guppy> hallo. ich habe gerade einen schönen platz in der nähe des steins gefunden. die temperatur fühlt sich gut an.
Du> hast du hunger
Guppy> ja. immer ja. ich schwimme jetzt gleich nach oben. ich verspreche, alles aufzuessen.
Du> was ist der sinn des lebens
Guppy> futter. die antwort ist immer futter.

Schnellstart

Mit Guppy chatten (kein Training nötig): Lädt das vortrainierte Modell von HuggingFace herunter. Einfach alle Zellen im Notebook ausführen.

Eigenes Modell trainieren: Runtime auf T4 GPU setzen, alle Zellen ausführen – lädt Datensatz herunter, trainiert Tokenizer, trainiert Modell, testet es. Auf HuggingFace hochladen oder lokal herunterladen.

Lokal chatten:

pip install torch tokenizers
python -m guppylm chat

Beispielinteraktion lokal:

Du> die katze schaut dich an
Guppy> ich verstecke mich hinter der pflanze, wenn das pelzige kommt.
Du> es regnet draußen
Guppy> ich denke, regen ist das beste an draußen.

Projektstruktur

guppylm/
├── config.py          # Hyperparameter (Modell + Training)
├── model.py           # Einfacher Transformer
├── dataset.py         # Datenladen + Batching
├── train.py           # Trainingsschleife (Cosinus-LR, AMP)
├── generate_data.py   # Konversationsdatengenerator (60 Themen)
├── eval_cases.py      # Zurückgehaltene Testfälle
├── prepare_data.py    # Datenvorbereitung + Tokenizer-Training
└── inference.py       # Chat-Schnittstelle

Dieses Projekt ist nützlich für Entwickler, die die Grundlagen der Transformer-Architektur verstehen möchten, ohne sich mit Milliarden-Parameter-Modellen auseinandersetzen zu müssen. Die vollständige Implementierung zeigt jeden Schritt von Rohtext zu trainierten Gewichten zu generierter Ausgabe.

📖 Source: HN LLM Tools

Ad

👀 Siehe auch

antirezs DS4: Ausführen von DeepSeek V4 Flash mit 1M Kontext auf Mac Metal und DGX
Werkzeuge

antirezs DS4: Ausführen von DeepSeek V4 Flash mit 1M Kontext auf Mac Metal und DGX

Redis-Erfinder Salvatore Sanfilippo hat DS4 veröffentlicht, ein Projekt, um DeepSeek V4 Flash mit einem 1M-Kontextfenster auf Mac Metal Hardware und DGX auszuführen, mit OpenAI/Anthropic-Endpunkten für agentische Codierungstools.

OpenClawRadar
Rift CLI: Verwalten Sie Git Worktrees für parallele KI-Agenten-Workflows
Werkzeuge

Rift CLI: Verwalten Sie Git Worktrees für parallele KI-Agenten-Workflows

Rift ist ein CLI-Tool, das isolierte Git-Worktrees und Branches erstellt, um mehrere KI-Coding-Agenten wie Claude Code gleichzeitig im selben Repository auszuführen. Es umfasst Lifecycle-Hooks, deterministisches Port-Mapping und Multi-Editor-Workspace-Unterstützung.

OpenClawRadar
Handoffs-Muster in Claude-Workflows: Zwei-Datei-Aufteilung vs. Ein-Dokument-Zusammenfassung
Werkzeuge

Handoffs-Muster in Claude-Workflows: Zwei-Datei-Aufteilung vs. Ein-Dokument-Zusammenfassung

Lange Claude-Sitzungen leiden unter Kontextverfall. Handoffs komprimieren das Wesentliche und starten neu. Zwei Ansätze: Matt Pococks Single-Dokument-Handoff-Skill vs. eine Zwei-Datei-Aufteilung mit persistentem Narrativ und ephemerem Prompt.

OpenClawRadar
Lucas Gerads demonstriert MCP-Server für die Integration von Oszilloskop und SPICE-Simulator mit Claude Code
Werkzeuge

Lucas Gerads demonstriert MCP-Server für die Integration von Oszilloskop und SPICE-Simulator mit Claude Code

Lucas Gerads hat MCP-Server für sein LeCroy-Oszilloskop und seinen SPICE-Simulator entwickelt, wodurch Claude Code SPICE-Schaltungen und -Modelle validieren, Embedded-Programmierung durchführen und Datenanalyseaufgaben wie Zeitachsen-Normalisierung und Datenausrichtung automatisieren kann.

OpenClawRadar