DeepSeek-V4-Flash macht LLM-Steuerung für lokale Modelle praktikabel

✍️ OpenClawRadar📅 Veröffentlicht: 16. Mai 2026🔗 Source
DeepSeek-V4-Flash macht LLM-Steuerung für lokale Modelle praktikabel
Ad

Der neueste Beitrag von Seen Goedecke argumentiert, dass DeepSeek-V4-Flash die Kalkulation für LLM-Steuerung verändert – die Technik, Modellaktivierungen während der Inferenz zu manipulieren, um Ausgaben zu lenken. Der Schlüsselfaktor ist DwarfStar, ein abgespeckter llama.cpp-Fork von antirez, der nur DeepSeek-V4-Flash ausführt und Steuerung als erstklassige Funktion integriert.

Was ist Steuerung?

Steuerung extrahiert ein Konzept (wie „antwort kurz“) aus den internen Aktivierungen des Modells. Eine Methode: Hundert Eingabeaufforderungen zweimal eingeben – einmal normal, einmal mit „antwort kurz“ ergänzt – dann die Aktivierungsmatrizen subtrahieren, um einen Steuerungsvektor zu erhalten. Diesen Vektor zu den Aktivierungen einer beliebigen Eingabe hinzufügen, und das Modell wird kurz angebunden. Ein fortgeschrittenerer Ansatz verwendet spärliche Autoencoder (wie die von Anthropic), um Merkmalsmuster zu lernen, allerdings zu höheren Kosten.

Ad

Warum es wichtig ist

Steuerung verspricht direkte Kontrolle über das Modellverhalten ohne Prompt-Engineering. Statt „Du MUSST“-Qualifikationen zu schreiben, hätte man einen Schieberegler für Prägnanz oder Gewissenhaftigkeit. Aus interpretatorischer Sicht ist es ebenfalls faszinierend – denken Sie an Golden Gate Claudes Fixierung, aber selbst einstellbar.

Warum nicht schon früher?

Steuerung war eine Idee der Mittelklasse: zu grob für große Labore (die trainieren das Modell einfach neu) und für API-Benutzer unzugänglich (kein Zugriff auf Gewichte oder Aktivierungen). Open-Weight-Modelle waren zu schwach, um sich damit zu befassen – bis DeepSeek-V4-Flash, das stark genug für agentisches Programmieren ist. Selbst dann übertrifft Prompting oft die Steuerung für einfache Eigenschaften wie Ausführlichkeit; der wahre Gewinn liegt in der Steuerung eines nicht durch Prompting erreichbaren Konzepts wie Intelligenz.

Goedecke plant, DwarfStar genau zu verfolgen. Zum Zeitpunkt des Schreibens ist die Steuerungsunterstützung rudimentär (nur ein Ausführlichkeits-Umschalter ähnlich dem Prompting), aber die Veröffentlichung liegt erst acht Tage zurück.

📖 Lesen Sie die vollständige Quelle: HN LLM Tools

Ad

👀 Siehe auch

Anthropic veröffentlicht kostenloses Bildungsprogramm inklusive Claude Code- und MCP-Mastery-Kurse.
Nachrichten

Anthropic veröffentlicht kostenloses Bildungsprogramm inklusive Claude Code- und MCP-Mastery-Kurse.

Anthropic hat sein gesamtes Bildungsprogramm kostenlos verfügbar gemacht, einschließlich Kursen zu Claude Code, MCP Mastery, API-Nutzung und KI-Kompetenz. Das Curriculum wird als universitätsniveau beschrieben und bietet strukturiertes Lernen im Vergleich zu zufälligen Tutorials.

OpenClawRadar
Organisationen, die GitHub per IP-Adresse blockieren, haben Verbindungsprobleme mit Claude
Nachrichten

Organisationen, die GitHub per IP-Adresse blockieren, haben Verbindungsprobleme mit Claude

Eine automatische Statusmeldung berichtet über Verbindungsfehler für Organisationen, die den GitHub-Zugriff per IP-Adresse einschränken, mit fortlaufender Incident-Verfolgung über status.claude.com.

OpenClawRadar
OpenClaw .23-Update verursacht Probleme mit Agenten und Datenverlust
Nachrichten

OpenClaw .23-Update verursacht Probleme mit Agenten und Datenverlust

Das OpenClaw .23-Update führt dazu, dass Agenten nicht mehr reagieren, Aufgaben nicht ausführen und die Verbindung zu Browser-Erweiterungen verlieren. Das Ausführen des Reparaturbefehls kann gesamte JSON-Konfigurationen löschen, was System-Backups zur Wiederherstellung erfordert.

OpenClawRadar
KI-Abo-Preiskollaps: Warum Ihre Unternehmensrechnung bald 10x höher ist
Nachrichten

KI-Abo-Preiskollaps: Warum Ihre Unternehmensrechnung bald 10x höher ist

KI-Labore wie OpenAI, Anthropic und Microsoft machen mit jedem Abonnement Verluste. Agentische Arbeitslasten haben das Pauschalpreismodell gesprengt – GitHub Copilot wechselt am 1. Juni 2026 zur nutzungsbasierten Abrechnung. Unternehmen, die auf subventionierte Preise gesetzt haben, steht eine Korrektur bevor.

OpenClawRadar