Aktueller Stand chinesischer LLMs: Marktführer, Open-Source-Modelle und Geschäftsmodelle

Dies ist eine Zusammenfassung der aktuellen chinesischen LLM-Szene basierend auf einer auf r/LocalLLaMA geteilten Recherche. Die Analyse kategorisiert die wichtigsten Akteure nach ihren proprietären Modellen, Open-Weight-Angeboten und Geschäftsansätzen.
Große Unternehmen und ihre Modelle
ByteDance: Ihr proprietäres Modell dola-seed (auch Doubao genannt) wird als derzeitiger Marktführer beschrieben und spielt eine ähnliche Rolle wie OpenAI. Sie haben auch ein Open-Source-Modell Seed OSS 36B, aber die Quelle merkt an, dass es nicht viel diskutiert wird.
Alibaba: Ihr proprietäres Modell Qwen Max wird angeblich nicht weit verbreitet genutzt. Alibaba wird jedoch als stärkster Anbieter von Open-Weight-Modellen, insbesondere kleineren Modellen, hervorgehoben und führt bei Text-zu-Bild (T2I) und Text-zu-Video (T2V) Fähigkeiten.
Tencent: Ihr proprietäres Modell Hunyuan wird ebenfalls nicht weit verbreitet genutzt. Ihre T2I- und T2V-Bemühungen gelten als zweitbeste nach Alibaba.
Baidu: Ihr proprietäres Modell Ernie wird nicht weit verbreitet genutzt, wobei Baidu im Bereich autonomes Fahren stärker ist.
Xiaomi: Ihr proprietäres Modell ist Mimo V2 Pro, und sie haben ein Open-Weight-Modell Mimo V2 Flash 309B-A15B.
DeepSeek: Das innovative Nebenprojekt
DeepSeek wird als ein Nebenprojekt einer algorithmischen Handelsfirma beschrieben. Die derzeitige Nutzung in China liegt angeblich knapp hinter ByteDances Doubao auf dem zweiten Platz, mit etwa der Hälfte der Nutzer. Die Quelle hebt DeepSeek als "das innovativste unter allen chinesischen LLM-Unternehmen" hervor, das Techniken wie MLA, MTP, DSA und GRPO erfunden hat. Die Analyse legt nahe, dass ihr Geschäftsmodell dem der 'Sechs KI-Kleintiger' ähneln könnte, spekuliert aber, dass das Projekt eher dazu dient, Investitionen anzuziehen und politischen Zugang zu erhalten.
Die Sechs KI-Kleintiger
Diese Gruppe zeichnet sich durch sehr ähnliche Geschäftsmodelle aus: Sie veröffentlichen große Open-Weight-Modelle, um Anerkennung zu gewinnen, während sie günstige Inferenzdienste anbieten. Die Quelle stellt ihre langfristige Überlebensfähigkeit in Frage.
- Zhipu: An der Hongkonger Börse gelistet. Ihr aktuelles Modell
GLM-5wird als Ableitung von DeepSeek beschrieben. - Minimax: An der Hongkonger Börse gelistet. Sie haben ein proprietäres Modell
MiniMax 2.7und ein Open-Weight-ModellMiniMax 2.5, das als "einfaches MoE 229B-A10B" beschrieben wird. Diese Architektur soll ihnen deutlich niedrigere Inferenzkosten als anderen bescheren. - Moonshot: Ihr Open-Weight-Modell
Kimiwird als Ableitung von DeepSeek beschrieben. - Stepfun: Ihr Open-Weight-Modell
Step 3.5 flashverwendet eine Mischung aus Full-Attention- und Sliding-Window-Attention (SWA) Layern im Verhältnis 1:3. Es wird als 196B-A11B-Modell mit einem Geschäftsmodell ähnlich dem von Minimax beschrieben, obwohl ihr Modell angeblich nicht so gut ist. - Baichuan: Ihr
Baichuan-M3 235Bwird als medizinisch verbessertes Open-Weight-Modell basierend aufQwen3Moebeschrieben. - 01 AI: Ihr letztes Open-Weight-Modell war
Yi-34B, veröffentlicht im November 2024. Sie konzentrieren sich nun angeblich auf KI-Agentensysteme für Unternehmen, was sie "für Leute hier irrelevant" macht.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Handelsstrategie-Benchmark: Günstigere KI-Modelle übertreffen Claude Opus 4.6
Ein Benchmark testete 10 LLMs auf die Entwicklung von Handelsstrategien, wobei günstigere Modelle wie Minimax 2.5 und Gemini 3.1 trotz ihrer 10-fach höheren Kosten Claude Opus 4.6 übertrafen. Das Experiment wurde dreimal mit konsistenten Ergebnissen durchgeführt.

Reddit-Benutzer schlägt Zeitstempelfunktion für Claude vor, um zeitliche Wahrnehmungslücke zu adressieren
Ein Reddit-Nutzer identifiziert Claudes mangelndes Zeitbewusstsein als Einschränkung für Produktivitätsanwendungsfälle und schlägt eine optionale Zeitstempelfunktion vor, die jede Antwort mit Datum und Uhrzeit versehen würde, die über Sitzungen hinweg bestehen bleibt.

OpenClaw-Ersteller-Credits Claude Code-Ingenieur trotz Anthropic-Abonnementsperre
Peter Steinberger, der Schöpfer des Open-Source-Claude-Code-Clients OpenClaw, würdigte öffentlich Boris Cherny von Anthropic für seine Bemühungen, die Auswirkungen von Anthropics Verbot der abonnementbasierten Nutzung von Drittanbieter-Clients abzumildern. Cherny antwortete, dass er Pull Requests eingereicht habe, um die Prompt-Cache-Effizienz speziell für OpenClaw zu verbessern.

OpenClaw April-Updates: Ein Monat der bahnbrechenden Änderungen und des verlorenen Vertrauens
Die April-Updates von OpenClaw zeigen ein Muster: Neue Funktionen und Fehlerbehebungen werden zusammen mit kritischen Bugs ausgeliefert. Postinstall-Skripte löschen Dateien, Sicherheitslücken auftauchen und Fähigkeiten sind defekt – das untergräbt das Vertrauen.