Gemma 4 veröffentlicht: Vier Modellgrößen für lokales KI-Hosting

Gemma 4 Modellspezifikationen
Gemma 4 ist jetzt als selbst gehostetes KI-Modell mit vier verschiedenen Konfigurationen für unterschiedliche Hardware-Szenarien verfügbar. Laut der Quelle konkurriert es nicht mit Claude, Codex oder Gemini, sondern positioniert sich als praktische Option für Multi-Routing-Szenarien, in denen ein kleines, leistungsfähiges, selbst gehostetes Modell Tokens sparen kann.
Modellvarianten und Hardwareanforderungen
- E2B (2,3 Milliarden effektive Parameter): Entwickelt für Edge-Geräte wie Smartphones und Raspberry Pi. Benötigt ~4-8 GB RAM und läuft gut auf einer CPU. Empfohlen für das Hosting auf VPS.
- E4B (4,5 Milliarden effektive Parameter): Entwickelt für Laptops und Low-End-Hardware. Behält einen geringen Speicherbedarf bei.
- 26B MoE (25 Milliarden gesamt, 3,8 Milliarden aktiv): Entwickelt für Consumer-GPUs. Läuft mit Inferenzgeschwindigkeiten ähnlich einem 4B-Modell.
- 31B Dense: Entwickelt für Mittelklasse-GPUs und Workstations. Benötigt etwa 16-20 GB VRAM bei Verwendung von 4-Bit-Quantisierung.
Fähigkeiten und Verfügbarkeit
Alle Gemma 4-Modelle sind multimodal mit Text- und Bildverarbeitungsfähigkeiten. Die E2B- und E4B-Edge-Modelle unterstützen speziell Echtzeit-Audio. Die Modelle sind für fortschrittliches Denken und agentenbasierte Workflows konzipiert.
Gemma 4 ist auf Google AI Studio, Hugging Face, Kaggle und Ollama verfügbar.
📖 Read the full source: r/openclaw
👀 Siehe auch

Anthropic veröffentlicht KI-Tool zur Analyse von COBOL-Codebasen, IBM-Aktie fällt um 13 %.
Anthropic hat ein KI-Tool veröffentlicht, das COBOL-Codebasen analysiert, um Risiken zu kennzeichnen und Modernisierungskosten zu senken. Die Ankündigung löste einen Kursrückgang von 13 % bei IBM aus, da der Markt dies als Bedrohung für IBMs Geschäft mit der Verwaltung von Altsystemen wahrnahm.

PS3-Emulator-Entwickler bitten Entwickler, keine KI-generierten PRs mehr einzureichen
RPCS3-Betreuer haben öffentlich darum gebeten, dass Nutzer aufhören, Pull-Requests einzureichen, die von KI-Code-Agenten erstellt wurden, und begründen dies mit geringer Qualität und hohem Wartungsaufwand.

Claude Code Postmortem: Drei Fehler führten zu Qualitätsminderung – jetzt behoben
Anthropic führte die jüngsten Qualitätsbeschwerden zu Claude Code auf drei separate Änderungen zurück: Der standardmäßige Reasoning-Aufwand wurde gesenkt, ein Caching-Fehler ließ das Sitzungsgedächtnis fallen, und ein Prompt zur Reduzierung der Ausführlichkeit beeinträchtigte die Code-Qualität. Alle wurden zum 20. April (v2.1.116) behoben.

Benchmark-Vergleich der Qwen 3.5-Modelle mit führenden KI-Modellen
Eine Benchmark-Vergleichswebsite enthält verifizierte Bewertungen und direkte Vergleichsinfografiken für Qwen-3.5-Modelle (122B, 35B, 27B, 397B) im Vergleich zu Modellen wie GPT-5.2, Claude 4.5 Opus, Gemini-3 Pro und anderen.