Chinesische LLMs 2025: Marktführer, Open-Source & Geschäftsmodelle

Dies ist eine Zusammenfassung der aktuellen chinesischen LLM-Szene basierend auf einer auf r/LocalLLaMA geteilten Recherche. Die Analyse kategorisiert die wichtigsten Akteure nach ihren proprietären Modellen, Open-Weight-Angeboten und Geschäftsansätzen.

Große Unternehmen und ihre Modelle

ByteDance: Ihr proprietäres Modell dola-seed (auch Doubao genannt) wird als derzeitiger Marktführer beschrieben und spielt eine ähnliche Rolle wie OpenAI. Sie haben auch ein Open-Source-Modell Seed OSS 36B, aber die Quelle merkt an, dass es nicht viel diskutiert wird.

Alibaba: Ihr proprietäres Modell Qwen Max wird angeblich nicht weit verbreitet genutzt. Alibaba wird jedoch als stärkster Anbieter von Open-Weight-Modellen, insbesondere kleineren Modellen, hervorgehoben und führt bei Text-zu-Bild (T2I) und Text-zu-Video (T2V) Fähigkeiten.

Tencent: Ihr proprietäres Modell Hunyuan wird ebenfalls nicht weit verbreitet genutzt. Ihre T2I- und T2V-Bemühungen gelten als zweitbeste nach Alibaba.

Baidu: Ihr proprietäres Modell Ernie wird nicht weit verbreitet genutzt, wobei Baidu im Bereich autonomes Fahren stärker ist.

Xiaomi: Ihr proprietäres Modell ist Mimo V2 Pro, und sie haben ein Open-Weight-Modell Mimo V2 Flash 309B-A15B.

DeepSeek: Das innovative Nebenprojekt

DeepSeek wird als ein Nebenprojekt einer algorithmischen Handelsfirma beschrieben. Die derzeitige Nutzung in China liegt angeblich knapp hinter ByteDances Doubao auf dem zweiten Platz, mit etwa der Hälfte der Nutzer. Die Quelle hebt DeepSeek als "das innovativste unter allen chinesischen LLM-Unternehmen" hervor, das Techniken wie MLA, MTP, DSA und GRPO erfunden hat. Die Analyse legt nahe, dass ihr Geschäftsmodell dem der 'Sechs KI-Kleintiger' ähneln könnte, spekuliert aber, dass das Projekt eher dazu dient, Investitionen anzuziehen und politischen Zugang zu erhalten.

Die Sechs KI-Kleintiger

Diese Gruppe zeichnet sich durch sehr ähnliche Geschäftsmodelle aus: Sie veröffentlichen große Open-Weight-Modelle, um Anerkennung zu gewinnen, während sie günstige Inferenzdienste anbieten. Die Quelle stellt ihre langfristige Überlebensfähigkeit in Frage.

Zhipu: An der Hongkonger Börse gelistet. Ihr aktuelles Modell GLM-5 wird als Ableitung von DeepSeek beschrieben.
Minimax: An der Hongkonger Börse gelistet. Sie haben ein proprietäres Modell MiniMax 2.7 und ein Open-Weight-Modell MiniMax 2.5, das als "einfaches MoE 229B-A10B" beschrieben wird. Diese Architektur soll ihnen deutlich niedrigere Inferenzkosten als anderen bescheren.
Moonshot: Ihr Open-Weight-Modell Kimi wird als Ableitung von DeepSeek beschrieben.
Stepfun: Ihr Open-Weight-Modell Step 3.5 flash verwendet eine Mischung aus Full-Attention- und Sliding-Window-Attention (SWA) Layern im Verhältnis 1:3. Es wird als 196B-A11B-Modell mit einem Geschäftsmodell ähnlich dem von Minimax beschrieben, obwohl ihr Modell angeblich nicht so gut ist.
Baichuan: Ihr Baichuan-M3 235B wird als medizinisch verbessertes Open-Weight-Modell basierend auf Qwen3Moe beschrieben.
01 AI: Ihr letztes Open-Weight-Modell war Yi-34B, veröffentlicht im November 2024. Sie konzentrieren sich nun angeblich auf KI-Agentensysteme für Unternehmen, was sie "für Leute hier irrelevant" macht.

📖 Read the full source: r/LocalLLaMA

Aktueller Stand chinesischer LLMs: Marktführer, Open-Source-Modelle und Geschäftsmodelle

Große Unternehmen und ihre Modelle

DeepSeek: Das innovative Nebenprojekt

Die Sechs KI-Kleintiger

👀 Siehe auch

Studie zeigt: Claude-Opus-Agent-Fehler waren architektonischer Natur, keine Alignment-Probleme

Claude-Abonnements decken keine Nutzung durch Drittanbieter-Harnesse mehr ab.

Claude Code v2.1.90 Veröffentlichung: Neue interaktive Lektionen, Leistungsverbesserungen und Fehlerbehebungen

Anthropic schränkt OpenClaw mit neuem Kreditsystem ein: Details und Auswirkungen