InclusionAI veröffentlicht Ring-2.6-1T: Billionen-Parameter-Modell für Agenten-Workflows

InclusionAI hat Ring-2.6-1T veröffentlicht, ein Reasoning-Modell mit einer Billion Parametern, das für reale Produktionsumgebungen entwickelt wurde – nicht nur für das Jagen von Benchmarks. Das Modell zielt auf agentische Arbeitsabläufe, Softwareentwicklung, wissenschaftliche Forschung und Unternehmensautomatisierung ab, bei denen langfristige Aufgaben Kontexterhaltung, Tool-Nutzung und Schrittablaufplanung erfordern.
Wichtige Fähigkeiten
- Agentenausführung: Wechselt vom Beantworten von Fragen zur Ausführung mehrstufiger Aufgaben, Tool-Zusammenarbeit und kontextbezogener Planung.
- Reasoning-Intensitätsmechanismus: Zwei Intensitätsstufen –
highundxhigh– ermöglichen Entwicklern einen Kompromiss zwischen Denktiefe und Geschwindigkeit/Kosten. - Asynchrones RL-Training: Nutzt asynchrones Reinforcement Learning mit dem IcePop-Algorithmus, um das Training von Modellen mit einer Billion Parametern für langfristige Aufgaben zu stabilisieren.
Das Modell ist auf Hugging Face zur Validierung und Anpassung durch Entwickler, Forscher und Unternehmen verfügbar.
📖 Vollständige Quelle lesen: r/LocalLLaMA
👀 Siehe auch

Claude Design Abrechnungsfehler: Zusätzlicher Nutzungskauf wird nicht angewendet, Support-Bot fängt zahlende Nutzer
Ein Benutzer von Claude Design zahlte 20 $ für zusätzliche Nutzung über den In-App-Kauf, aber die Guthaben gelten nicht für das separate Nutzungslimit von Claude Design. Der Support-Bot Fin interpretiert das Problem falsch, wiederholt irrelevante Antworten und blockiert neue Tickets ohne Eskalation an einen Menschen.

Führende KI-Modelle zeigen Leistungslücken bei nicht-englischen Sprachen
Eine aktuelle Analyse zeigt, dass führende KI-Modelle in anderen Sprachen als Englisch schlechter abschneiden. Der Artikel erhielt 16 Punkte und 3 Kommentare auf Hacker News.

Meta übernimmt Moltbook, ein Reddit-ähnliches Forum für KI-Agenten
Meta hat Moltbook übernommen, eine Reddit-ähnliche Forumplattform, die speziell für KI-Agenten entwickelt wurde. Die Übernahme wurde am Dienstag bestätigt, wobei die Gründer von Moltbook zu Metas Superintelligence Labs wechseln.

RTX 5080 16 GB: Qwen3.6 35B MoE bei 128k Kontext — 56 Tok/s und warum MTP nicht hilft
Neue Benchmarks zeigen, dass Qwen3.6 35B MoE auf einer RTX 5080 16GB bei 128k Kontext 56 tok/s generiert. MTP (Multi-Token Prediction) ist 23% langsamer, da VRAM-Druck Expertenschichten auf die CPU verlagert.