Gemma 4 veröffentlicht: Vier Modellgrößen für lokales KI-Hosting

✍️ OpenClawRadar📅 Veröffentlicht: 6. April 2026🔗 Source
Gemma 4 veröffentlicht: Vier Modellgrößen für lokales KI-Hosting
Ad

Gemma 4 Modellspezifikationen

Gemma 4 ist jetzt als selbst gehostetes KI-Modell mit vier verschiedenen Konfigurationen für unterschiedliche Hardware-Szenarien verfügbar. Laut der Quelle konkurriert es nicht mit Claude, Codex oder Gemini, sondern positioniert sich als praktische Option für Multi-Routing-Szenarien, in denen ein kleines, leistungsfähiges, selbst gehostetes Modell Tokens sparen kann.

Modellvarianten und Hardwareanforderungen

  • E2B (2,3 Milliarden effektive Parameter): Entwickelt für Edge-Geräte wie Smartphones und Raspberry Pi. Benötigt ~4-8 GB RAM und läuft gut auf einer CPU. Empfohlen für das Hosting auf VPS.
  • E4B (4,5 Milliarden effektive Parameter): Entwickelt für Laptops und Low-End-Hardware. Behält einen geringen Speicherbedarf bei.
  • 26B MoE (25 Milliarden gesamt, 3,8 Milliarden aktiv): Entwickelt für Consumer-GPUs. Läuft mit Inferenzgeschwindigkeiten ähnlich einem 4B-Modell.
  • 31B Dense: Entwickelt für Mittelklasse-GPUs und Workstations. Benötigt etwa 16-20 GB VRAM bei Verwendung von 4-Bit-Quantisierung.
Ad

Fähigkeiten und Verfügbarkeit

Alle Gemma 4-Modelle sind multimodal mit Text- und Bildverarbeitungsfähigkeiten. Die E2B- und E4B-Edge-Modelle unterstützen speziell Echtzeit-Audio. Die Modelle sind für fortschrittliches Denken und agentenbasierte Workflows konzipiert.

Gemma 4 ist auf Google AI Studio, Hugging Face, Kaggle und Ollama verfügbar.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

Anthropic veröffentlicht KI-Tool zur Analyse von COBOL-Codebasen, IBM-Aktie fällt um 13 %.
Nachrichten

Anthropic veröffentlicht KI-Tool zur Analyse von COBOL-Codebasen, IBM-Aktie fällt um 13 %.

Anthropic hat ein KI-Tool veröffentlicht, das COBOL-Codebasen analysiert, um Risiken zu kennzeichnen und Modernisierungskosten zu senken. Die Ankündigung löste einen Kursrückgang von 13 % bei IBM aus, da der Markt dies als Bedrohung für IBMs Geschäft mit der Verwaltung von Altsystemen wahrnahm.

OpenClawRadar
PS3-Emulator-Entwickler bitten Entwickler, keine KI-generierten PRs mehr einzureichen
Nachrichten

PS3-Emulator-Entwickler bitten Entwickler, keine KI-generierten PRs mehr einzureichen

RPCS3-Betreuer haben öffentlich darum gebeten, dass Nutzer aufhören, Pull-Requests einzureichen, die von KI-Code-Agenten erstellt wurden, und begründen dies mit geringer Qualität und hohem Wartungsaufwand.

OpenClawRadar
Claude Code Postmortem: Drei Fehler führten zu Qualitätsminderung – jetzt behoben
Nachrichten

Claude Code Postmortem: Drei Fehler führten zu Qualitätsminderung – jetzt behoben

Anthropic führte die jüngsten Qualitätsbeschwerden zu Claude Code auf drei separate Änderungen zurück: Der standardmäßige Reasoning-Aufwand wurde gesenkt, ein Caching-Fehler ließ das Sitzungsgedächtnis fallen, und ein Prompt zur Reduzierung der Ausführlichkeit beeinträchtigte die Code-Qualität. Alle wurden zum 20. April (v2.1.116) behoben.

OpenClawRadar
Benchmark-Vergleich der Qwen 3.5-Modelle mit führenden KI-Modellen
Nachrichten

Benchmark-Vergleich der Qwen 3.5-Modelle mit führenden KI-Modellen

Eine Benchmark-Vergleichswebsite enthält verifizierte Bewertungen und direkte Vergleichsinfografiken für Qwen-3.5-Modelle (122B, 35B, 27B, 397B) im Vergleich zu Modellen wie GPT-5.2, Claude 4.5 Opus, Gemini-3 Pro und anderen.

OpenClawRadar