Gemma 4: Vier Modellgrößen für Lokales KI-Hosting

Gemma 4 Modellspezifikationen

Gemma 4 ist jetzt als selbst gehostetes KI-Modell mit vier verschiedenen Konfigurationen für unterschiedliche Hardware-Szenarien verfügbar. Laut der Quelle konkurriert es nicht mit Claude, Codex oder Gemini, sondern positioniert sich als praktische Option für Multi-Routing-Szenarien, in denen ein kleines, leistungsfähiges, selbst gehostetes Modell Tokens sparen kann.

Modellvarianten und Hardwareanforderungen

E2B (2,3 Milliarden effektive Parameter): Entwickelt für Edge-Geräte wie Smartphones und Raspberry Pi. Benötigt ~4-8 GB RAM und läuft gut auf einer CPU. Empfohlen für das Hosting auf VPS.
E4B (4,5 Milliarden effektive Parameter): Entwickelt für Laptops und Low-End-Hardware. Behält einen geringen Speicherbedarf bei.
26B MoE (25 Milliarden gesamt, 3,8 Milliarden aktiv): Entwickelt für Consumer-GPUs. Läuft mit Inferenzgeschwindigkeiten ähnlich einem 4B-Modell.
31B Dense: Entwickelt für Mittelklasse-GPUs und Workstations. Benötigt etwa 16-20 GB VRAM bei Verwendung von 4-Bit-Quantisierung.

Fähigkeiten und Verfügbarkeit

Alle Gemma 4-Modelle sind multimodal mit Text- und Bildverarbeitungsfähigkeiten. Die E2B- und E4B-Edge-Modelle unterstützen speziell Echtzeit-Audio. Die Modelle sind für fortschrittliches Denken und agentenbasierte Workflows konzipiert.

Gemma 4 ist auf Google AI Studio, Hugging Face, Kaggle und Ollama verfügbar.

📖 Read the full source: r/openclaw

Gemma 4 veröffentlicht: Vier Modellgrößen für lokales KI-Hosting

Gemma 4 Modellspezifikationen

Modellvarianten und Hardwareanforderungen

Fähigkeiten und Verfügbarkeit

👀 Siehe auch

Gemma 4 Frühe Signale: Praxistauglichkeit vor Hype für lokale Agenten-Workflows

OpenClaw Diskussion über KI-Agent-zu-Agent-Kommunikation und Kontextfreigabe

Mercury 2: Diffusionsbasiertes Modell für Echtzeit-KI-Codierung

Aufmerksamkeitssteuerung: Die Herausforderung des selektiven Vergessens in KI-Gedächtnissystemen