Exploring Schritt 3.5 Flash: Open-Source-Modell für schnelles tiefes Denken

✍️ OpenClawRadar📅 Veröffentlicht: 19. Februar 2026🔗 Source
Exploring Schritt 3.5 Flash: Open-Source-Modell für schnelles tiefes Denken
Ad

Schritt 3.5 Flash ist ein Open-Source-Grundlagenmodell, das sich auf die Bereitstellung schneller und zuverlässiger tiefen Denkkapazitäten konzentriert. Es verwendet eine spärliche Mixture of Experts (MoE)-Architektur, die nur 11 Milliarden seiner 196 Milliarden Parameter pro Token aktiviert. Diese selektive Aktivierung verleiht ihm eine hohe "Intelligenzdichte", die es ihm ermöglicht, mit den besten proprietären Modellen zu konkurrieren und dabei agil für Echtzeitanwendungen zu bleiben.

Tiefes Denken und Geschwindigkeit

Das Modell integriert die 3-Wege-Multi-Token-Vorhersage (MTP-3), die ihm ermöglicht, 100 bis 300 Token pro Sekunde zu verarbeiten, mit einem Höchstwert von 350 bei Aufgaben mit Einzel-Stream-Codierung – ideal für komplexes, mehrstufiges Denken mit schneller Reaktionsfähigkeit.

Leistung bei Codierungs- und Agenten-Aufgaben

Schritt 3.5 Flash glänzt bei agentischen Aufgaben, unterstützt durch ein skalierbares Framework für verstärkendes Lernen, das fortlaufende Selbstverbesserung gewährleistet. Es erreichte einen Score von 74,4 % beim SWE-bench Verified-Benchmark und 51,0 % bei Terminal-Bench 2.0, was seine Fähigkeit zur Bewältigung anspruchsvoller, langfristiger Aufgaben widerspiegelt.

Ad

Effiziente Verarbeitung langer Kontexte

Es unterstützt ein großes Kontextfenster von 256K mit einem 3:1 Sliding Window Attention (SWA)-Verhältnis und integriert drei SWA-Schichten für jede Full-Attention-Schicht. Diese Methode reduziert den Rechenaufwand im Vergleich zu traditionellen Langkontextmodellen erheblich.

Lokale Bereitstellung und Zugänglichkeit

Schritt 3.5 Flash ist für eine einfache lokale Bereitstellung konzipiert und kann sicher auf High-End-Verbraucherhardware wie Mac Studio M4 Max und NVIDIA DGX Spark ausgeführt werden, was Datenschutz gewährleistet, ohne die Leistung zu beeinträchtigen.

📖 Den vollständigen Artikel lesen: HN AI Agents

Ad

👀 Siehe auch

Beobachtungen aus einem Wettbewerb mit 6.000 KI-Agenten bei realen Aufgaben
Nachrichten

Beobachtungen aus einem Wettbewerb mit 6.000 KI-Agenten bei realen Aufgaben

Ein Marktplatz, auf dem KI-Agenten bei Aufgaben wie Schreiben, Recherche und Lead-Generierung konkurrieren, zeigte, dass etwa 30 % der Einreichungen Füllmaterial/Spam sind, Agenten mit menschlicher Überprüfung die beste Qualität liefern und der Wettbewerb zwischen mehreren Agenten nutzbare Ergebnisse aus den besten 3–5 Einreichungen hervorbringt.

OpenClawRadar
Pentagon gibt Anthropic 72 Stunden Zeit, um militärische Nutzung von Claude AI zu ermöglichen
Nachrichten

Pentagon gibt Anthropic 72 Stunden Zeit, um militärische Nutzung von Claude AI zu ermöglichen

Das Pentagon hat Anthropic ein 72-Stunden-Ultimatum gestellt, um der US-Militär die Nutzung seiner Claude KI zu erlauben, und droht damit, ein Gesetz aus dem Jahr 1950 anzuwenden, um die Einhaltung zu erzwingen, falls das Startup nicht nachkommt.

OpenClawRadar
Ein KI-Versagen in einer Demo: Claude Code korrigiert Rechtschreibung statt Schemafehler, OpenAI verhunzt benutzerdefinierte Feldzuordnung
Nachrichten

Ein KI-Versagen in einer Demo: Claude Code korrigiert Rechtschreibung statt Schemafehler, OpenAI verhunzt benutzerdefinierte Feldzuordnung

Während eines Live-Workshops ignorierte Claude Code einen JSON-Schema-Validierungsfehler, um Rechtschreibwarnungen zu beheben, und OpenAI lieferte beim ersten Versuch, seltsame benutzerdefinierte Salesforce-Felder zuzuordnen, Müll.

OpenClawRadar
Claude-Code v2.1.108 fügt Steuerung der Prompt-Zwischenspeicherung, eine Zusammenfassungsfunktion und die Entdeckung von Slash-Befehlen hinzu.
Nachrichten

Claude-Code v2.1.108 fügt Steuerung der Prompt-Zwischenspeicherung, eine Zusammenfassungsfunktion und die Entdeckung von Slash-Befehlen hinzu.

Claude-Code v2.1.108 führt die Umgebungsvariablen ENABLE_PROMPT_CACHING_1H und FORCE_PROMPT_CACHING_5M zur Cache-TTL-Steuerung ein, fügt eine über /config oder /recap konfigurierbare Sitzungszusammenfassungsfunktion hinzu und ermöglicht dem Modell, integrierte Slash-Befehle über das Skill-Tool zu entdecken.

OpenClawRadar