Hy3 LLM führt die OpenRouter-Rangliste an: Günstigstes Modell oder doch etwas anderes?

Ein mysteriöses LLM namens Hy3 preview ist an die Spitze der OpenRouter AI Model Rankings geschnellt und hat etablierte Modelle wie Claude Opus 4.7 und DeepSeek V4 Flash bei der Token-Nutzung um mehr als 50 % überflügelt. Das Modell, ein Open-Source-Release des chinesischen Megakonzerns Tencent, ist auf OpenRouter zu $0,066/1M Input-Tokens erhältlich und damit das günstigste große Modell auf der Plattform – noch günstiger als DeepSeek V4 Flash mit $0,10/1M Input-Tokens.
Die Qualität des Modells spiegelt jedoch nicht seine Popularität wider. Tencents eigenes Hugging-Face-Repo zeigt seltsam ehrliche Benchmark-Ergebnisse, die für Hy3 im Vergleich zu anderen chinesischen Open-Source-Modellen nicht vorteilhaft sind. Tests des Autors deuten darauf hin, dass die Qualität des Modells mit anderen chinesischen Modellen vergleichbar ist, aber nicht an Claude Opus 4.7 oder GPT 5.5 heranreicht.
Die Daten von OpenRouter offenbaren mehrere Besonderheiten:
- Nutzungsspitze: Hy3 preview hatte vor dem 8. Mai 2026 keine Nutzung, als es von einem kostenlosen SKU auf kostenpflichtig umstellte. Seitdem ist die Nutzung stetig gestiegen, was auf eine organische Übernahme hindeutet.
- App-Nutzung minimal: Die Top-5-Apps machen <1 % aller Aktivitäten auf Hy3 aus. Dies schließt aus, dass eine einzelne App das Standardmodell umgestellt hat (wie zuvor bei Grok Code Fast 1 geschehen).
- 98 % Input-Tokens, 2 % Output – ein extremes Verhältnis, das auf eine starke Nutzung in Retrieval- oder Vorverarbeitungsaufgaben hindeutet, nicht auf agentische Codierungs-Schleifen.
- Einzelner Anbieter: Hy3 preview ist nur über SiliconFlow verfügbar, einen in Singapur ansässigen Anbieter, der einen massiven Nutzungsanstieg parallel zu Hy3 verzeichnete.
Als Hy3 von kostenlos auf kostenpflichtig umstellte, ging die Nutzung nicht signifikant zurück, was darauf hindeutet, dass die Nutzer trotz der geringeren Qualität des Modells bereit sind zu zahlen – wahrscheinlich, weil es die günstigste Option auf OpenRouter bleibt. Der Autor fragt: Ist Hy3 preview tatsächlich das günstigste LLM eines großen Unternehmens auf OpenRouter?
Entwickler, die KI-Codierungs-Agenten einsetzen, sollten sich bewusst sein, dass Kosteneinsparungen zu Lasten der Qualität gehen können. Wenn Sie hochvolumige Inferenz durchführen, bei der die Ausgabequalität weniger kritisch ist (z. B. Datenextraktion, einfache Klassifikation), könnte Hy3 eine brauchbare Option sein. Für komplexe agentische Codierung sind jedoch deutlich schlechtere Ergebnisse im Vergleich zu Claude oder GPT zu erwarten.
📖 Vollständige Quelle lesen: HN AI Agents
👀 Siehe auch

Claude Code Systemprompt-Montage und Struktur enthüllt
Ein Source-Map-Leck im npm-Paket von Claude Code legte den System-Prompt-Erstellungsprozess offen, der statische Präfixabschnitte gefolgt von dynamischen, sitzungsspezifischen Inhalten zeigt, mit drei Identitätsvarianten und detaillierten Ausführungsrichtlinien.

Claude-Quellcode-Leak enthüllt Anti-Distillation, Undercover-Modus und Frustrationserkennung
Eine geleakte Source-Code-Map-Datei aus dem Claude-Code-npm-Paket enthüllt Anti-Distillationstechniken mit gefälschten Tools, einen Undercover-Modus, der die KI-Autorschaft verbirgt, und Frustrationserkennung über Regex-Muster.

Claude fehlt technisches Gedächtnis: Bereitschaftsvorfall zeigt fehlendes episodisches Abrufen von Debugging-Reisen
Ein Entwickler verbrachte 10 Stunden damit, einen Kafka-Burst-Fehler in einem Monorepo mit 1500 Dateien zu debuggen, nur um festzustellen, dass er das exakt gleiche Problem vor 4 Monaten bereits gelöst hatte – ein Hinweis darauf, dass KI-Codierungsassistenten wie Claude kein episodisches Gedächtnis für vergangene Debugging-Reisen haben.

Claude Code 2.1.76 fügt MCP-Abfrage, Worktree-Verbesserungen und Korrekturen für Kontextlimits hinzu
Claude Code Version 2.1.76 führt MCP-Abfrageunterstützung für strukturierte Eingaben während Aufgaben ein, fügt worktree.sparsePaths für große Monorepos hinzu und behebt 'Kontextlimit erreicht'-Fehler bei 1M-Kontext-Sitzungen. Version 2.1.75 machte 1M-Kontextfenster standardmäßig für Opus 4.6 auf Max-, Team- und Enterprise-Plänen verfügbar.