40 KI-Modelle im Benchmark: God Mode vs Flash Mode

Die jüngste Bewertung von 40 neuen KI-Modellen bringt bedeutende Verschiebungen im Preis-Leistungs-Verhältnis ans Licht. Mit einem Fokus auf Kimi k2.5 und Claude Opus 4.6 zeigt die Analyse eine Teilung in zwei Extreme: 'God Mode' und 'Flash Mode', wodurch Mittelklasse-Modelle ineffektiv werden.

Wichtige Details

Kimi k2.5 Situation: Versuche, Kimi k2.5 zu bewerten, schlugen fehl aufgrund anhaltender 'No Content'-Fehler, vermutlich bedingt durch Überlastung. Dennoch schnitt Kimi-k2-Thinking für komplexe Denkaufgaben mit ~15 TPS angemessen ab.
Geschwindigkeitsdominanz: Für latenzempfindliche Anwendungen erwies sich Liquid LFM 2.5 als das schnellste Modell mit ~359 Tokens/Sekunde, gefolgt von Ministral 3B mit ~293 Tokens/Sekunde.
Kosteneffizienz: Ministral 3B hebt sich als die kosteneffektivste Lösung hervor, mit $0.10/1M Eingab tokens. Es ist ~17x günstiger und ~40% schneller als GPT-5.2 Codex, was es zu einer starken Wahl gegen höherpreisige Optionen macht.

Die Empfehlung lautet, Mittelklasse-Modelle, die zwischen $0.50 - $1.00 kosten, zu vermeiden, da sie keine wettbewerbsfähige Leistung bieten. Je nach Ihren Bedürfnissen sollten Sie höherpreisige Modelle wie Opus/GPT-5 für Intelligenz auswählen oder eine kostengünstige Geschwindigkeit mit Liquid/Mistral wählen.

📖 Lesen Sie die vollständige Quelle: r/LocalLLaMA

Benchmarking der neuesten KI-Modelle: Der Aufstieg der extremen Modelle

Wichtige Details

👀 Siehe auch

Claude-Code v2.1.97 Veröffentlichung: NO_FLICKER-Verbesserungen, Berechtigungsbehebungen und MCP-Updates

Entkoppeltes DiLoCo: Robuster verteilter Training über Rechenzentren mit geringer Bandbreite

Nvidia investiert 26 Milliarden Dollar in Open-Weight-KI-Modelle und veröffentlicht Nemotron 3 Super

OpenClaw 2026.3.2 Release: Produktionsgeheimnisse, PDF-Tool und sicherere Standardeinstellungen