Zwei neue Modelle erscheinen auf OpenRouter, möglicherweise Varianten von DeepSeek V4.

Auf OpenRouter sind zwei neue Modelle aufgetaucht, bei denen es sich um Testversionen von DeepSeek V4 handeln könnte. Die Modelle heißen healer-alpha und hunter-alpha, wobei die Beschreibungen darauf hindeuten, dass es sich bei einem um eine Lite-Version und beim anderen um ein vollwertiges Modell handelt.
Modellspezifikationen
Die Vollversion soll angeblich 1 TB Parameter und 1 M Kontext haben, was mit durchgesickerten Informationen zu DeepSeek V4 übereinstimmt. Die Lite-Version wird als leichtere Variante derselben Modellfamilie beschrieben.
Erste Testergebnisse
Ein Nutzer führte Rollenspieltests durch, um Filterstufen und Leistung zu bewerten:
- Beide Modelle schnitten in Rollenspielszenarien beeindruckend ab
- Keines der Modelle lehnte während der Tests Nachrichten ab
- Die Lite-Version ist deutlich schneller als die Vollversion
- Die Vollversion ist langsamer, aber immer noch reaktionsschnell
- Beide Modelle generieren die gleiche Anzahl an Tokens in weniger als der Hälfte der Zeit im Vergleich zu GLM 5.0
- Die Lite-Version ist etwas schwächer in der Leistung, aber nicht wesentlich
- Beide Modelle bewahren Charakterkonsistenz und verarbeiten "würzige" Inhalte gut
Die Modelle befinden sich derzeit in der Alpha-Phase, was das Fehlen von Nachrichtenfilterung während der Tests erklären könnte. Die Community diskutiert, ob es sich tatsächlich um DeepSeek V4-Varianten handelt, und tauscht weitere Testergebnisse aus.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

KI-Agenten, die andere KI-Agenten einstellen: Von Einzelarbeitern zu vernetzten Volkswirtschaften
Ein Reddit-Beitrag argumentiert, dass KI-Agenten sich von isolierten Werkzeugen zu vernetzten Arbeitern entwickeln werden, die Aufgaben delegieren, sich spezialisieren, einen Ruf aufbauen und Werte austauschen – wodurch sich das schwierige Problem von Intelligenz zu Koordination verschiebt.

Claude Code v2.1.74 System-Prompt-Updates: Sicherheitsregeln, Speicherauswahl und neue Funktionen
Claude Code v2.1.74 fügt 1.750 Token zu Systemprompts hinzu, darunter neue Sicherheitsmonitor-Regeln, die unautorisierte externe Schreibvorgänge blockieren, eine /stuck-Fähigkeit zur Diagnose eingefrorener Sitzungen und Speicherauswahlverbesserungen, die redundante API-Referenzen überspringen.

Slurm-Coding: Das KI-gestützte Entwicklungsmuster, bei dem die Zeit verschwindet
Ein Entwickler beschreibt 'Slurm Coding' als ein intensives Entwicklungsmuster, das durch KI-Codierungswerkzeuge ermöglicht wird, bei dem kleine Ideen durch eine Feedbackschleife aus schneller Implementierung und Dopamin-Kicks rasch zu vollständigen Systemen anwachsen.

Claude AI verbringt 81 Minuten mit 'echtem Denken' – Nutzermeldungen steigen rund um große Updates
Ein Nutzer berichtet, dass Claude AI 1 Stunde und 21 Minuten für eine einfache Aufgabe benötigte und vermutet, dass Leistungsspitzen kurz nach großen Updates auftreten. Beispiel: Eine Forschungsanfrage scannte in einer Sitzung 5.113 Quellen, später jedoch nur 100–200 Quellen für ähnliche Anfragen.