Sarvam AI veröffentlicht 30B und 105B Open-Source-LLMs mit indischer Trainingsinfrastruktur.

✍️ OpenClawRadar📅 Veröffentlicht: 7. März 2026🔗 Source
Sarvam AI veröffentlicht 30B und 105B Open-Source-LLMs mit indischer Trainingsinfrastruktur.
Ad

Modellspezifikationen und Architektur

Sarvam 30B und Sarvam 105B sind Reasoning-Modelle, die von Grund auf auf groß angelegten, hochwertigen Datensätzen trainiert wurden, die intern über die Phasen Vorabtraining, überwachte Feinabstimmung und Reinforcement Learning kuratiert wurden. Das Training wurde vollständig in Indien auf Rechenleistung durchgeführt, die im Rahmen der IndiaAI-Mission bereitgestellt wurde.

Beide Modelle verwenden ein Mixture-of-Experts (MoE) Transformer-Grundgerüst mit sparsamem Expert-Routing, um die Parameteranzahl zu skalieren, ohne die Rechenleistung pro Token zu erhöhen. Die Architektur unterstützt langkontextige Eingaben durch rotierende Positions-Einbettungen, RMSNorm-basierte Stabilisierung und Attention-Designs, die für eine effiziente KV-Cache-Nutzung während der Inferenz optimiert sind.

Sarvam 30B verwendet Grouped Query Attention (GQA), um den KV-Cache-Speicher zu reduzieren und gleichzeitig die Leistung aufrechtzuerhalten. Sarvam 105B erweitert die Architektur mit größerer Tiefe und Multi-head Latent Attention (MLA), einer komprimierten Attention-Formulierung, die den Speicherbedarf für langkontextige Inferenz reduziert. Beide Modelle verwenden sparsame Expert-Feedforward-Schichten mit 128 Experten, unterscheiden sich jedoch in der Expertenkapazität und Routing-Konfiguration.

Ad

Trainings- und Datendetails

Das 30B-Modell wurde auf 16T Tokens trainiert, während das 105B-Modell auf 12T Tokens trainiert wurde. Die Vorabtrainingsdaten umfassen Code, allgemeine Webdaten, spezialisierte Wissenskorpora, Mathematik und mehrsprachige Inhalte mit einem erheblichen Anteil für die 10 am häufigsten gesprochenen indischen Sprachen.

Das Training verwendete sigmoidbasierte Routing-Scores anstelle traditioneller Softmax-Gating, was die Expertenlastverteilung verbessert und Routing-Kollaps reduziert. Ein Experten-Bias-Term stabilisiert die Routing-Dynamik und fördert eine gleichmäßigere Expertennutzung über die Trainingsschritte hinweg.

Das Vorabtraining wurde in drei Phasen durchgeführt: Langzeit-Vorabtraining, Mitteltraining und eine Langkontext-Erweiterungsphase. Das 105B-Modell erreichte früh im Training eine Benchmark-Überlegenheit gegenüber dem 30B-Modell, was auf ein effizientes Skalierungsverhalten hindeutet.

Leistung und Bereitstellung

Sarvam 105B schneidet bei Reasoning-, Programmier- und agentenbasierten Aufgaben über Benchmarks hinweg gut ab. Sarvam 30B ist für die Echtzeit-Bereitstellung optimiert und zeigt eine starke Leistung bei realen Konversationsanwendungsfällen. Beide Modelle erzielen state-of-the-art Ergebnisse bei indischen Sprach-Benchmarks und übertreffen deutlich größere Modelle.

Sarvam 30B treibt Samvaad an, Sarvams Konversationsagenten-Plattform. Sarvam 105B treibt Indus an, ihren KI-Assistenten, der für komplexes Reasoning und agentenbasierte Workflows entwickelt wurde.

Zugang und Implementierung

Die Gewichte können von AI Kosh (30B, 105B) und Hugging Face (30B, 105B) heruntergeladen werden. Für lokale Inferenz mit Transformers, vLLM und SGLang verweisen wir auf die Hugging Face Models-Seite für Beispielimplementierungen. Beide Modelle sind über Sarvams API auf ihrem API-Dashboard zugänglich.

📖 Read the full source: HN LLM Tools

Ad

👀 Siehe auch

Claude Code v2.1.101 fügt Team-Onboarding, Enterprise-TLS-Unterstützung hinzu und behebt Speicherlecks.
Nachrichten

Claude Code v2.1.101 fügt Team-Onboarding, Enterprise-TLS-Unterstützung hinzu und behebt Speicherlecks.

Claude Code v2.1.101 führt den Befehl /team-onboarding zur Erstellung von Einarbeitungsleitfäden für Teammitglieder ein, aktiviert standardmäßig das Vertrauen in den OS-CA-Zertifikatsspeicher für Unternehmens-TLS-Proxys und behebt einen Speicherleck in langen Sitzungen sowie über 25 weitere Verbesserungen und Fehlerbehebungen.

OpenClawRadar
Claude Opus 4.7 System-Prompt-Änderungen: Plattformumbenennung, Tool-Integration und Verhaltensaktualisierungen
Nachrichten

Claude Opus 4.7 System-Prompt-Änderungen: Plattformumbenennung, Tool-Integration und Verhaltensaktualisierungen

Anthropic aktualisierte das Claude-Opus-System-Prompt von Version 4.6 (5. Februar 2026) auf 4.7 (16. April 2026), benannte die 'Developer Platform' in 'Claude Platform' um, fügte Claude in Powerpoint zur Werkzeugliste hinzu, erweiterte die Kinderschutz-Anweisungen und implementierte neue Verhaltensrichtlinien für die Werkzeugnutzung und Antwortprägnanz.

OpenClawRadar
Claude Code wurde aus dem Anthropic Pro-Plan entfernt und ist jetzt nur noch in Max-Plänen verfügbar.
Nachrichten

Claude Code wurde aus dem Anthropic Pro-Plan entfernt und ist jetzt nur noch in Max-Plänen verfügbar.

Anthropic hat Claude Code aus seinem Pro-Plan (17-20 $/Monat) entfernt und macht ihn nur noch in Max-Plänen ab 100 $/Monat verfügbar. Der Pro-Plan umfasst nun Claude Cowork, unbegrenzte Projekte, die Recherche-Funktion und Zugang zu mehr Claude-Modellen.

OpenClawRadar
Microsoft Copilot fügt Anzeigen in GitHub- und GitLab-Pull-Requests ein.
Nachrichten

Microsoft Copilot fügt Anzeigen in GitHub- und GitLab-Pull-Requests ein.

Microsoft Copilot hat Berichten zufolge Werbung in 1,5 Millionen GitHub-Pull-Requests eingefügt und betrifft auch GitLab. Die Werbung erscheint innerhalb von Pull-Request-Beschreibungen, die vom KI-Coding-Assistenten generiert werden.

OpenClawRadar