Lokale Feinabstimmung von Llama 3.2-1B zur Geheimniserkennung übertrifft Wizs Modell

✍️ OpenClawRadar📅 Veröffentlicht: 16. April 2026🔗 Source
Lokale Feinabstimmung von Llama 3.2-1B zur Geheimniserkennung übertrifft Wizs Modell
Ad

Ein Entwickler hat seine erfolgreiche lokale Feinabstimmung von Llama 3.2-1B für die Geheimniserkennung in Code dokumentiert und dabei die Metriken eines ähnlichen Modells von Wiz übertroffen. Das Projekt wurde vollständig mit lokalen KI-Tools durchgeführt, ohne proprietäre APIs zu nutzen.

Wichtige Ergebnisse und Vorgehensweise

Der Entwickler wollte die Ergebnisse von Wiz von 86 % Präzision und 82 % Recall replizieren oder übertreffen. Nach einigen Wochenenden Arbeit erreichte er gleichzeitig 88 % Präzision und 84,4 % Recall mit einem feinabgestimmten Llama 3.2-1B-Modell. Er testete auch Qwen 3.5-2B- und 4B-Modelle, die das 1B-Modell übertrafen, jedoch mit höherem VRAM-Verbrauch und längeren Inferenzzeiten.

Datensatz und Trainingsprozess

Die Arbeit stützte sich ausschließlich auf öffentlich verfügbare Daten, die unzureichend waren, daher wurde prozedurale Generierung verwendet, um den Datensatz zu erweitern und zu verbessern. Alle Kennzeichnungen wurden lokal mit dem Qwen3-Coder-Next-Modell durchgeführt. Ein wichtiges Trainingsziel war, dass die Modelle strukturiertes JSON ausgeben. Anfangs erzielten ungeschulte Modelle (Llama & Qwen) 0 % bei der Schema-Konformität, aber nach dem Training verbesserte sich dies auf 98–100 %.

Ad

Herausforderungen und Erkenntnisse

Der Entwickler stieß während des Prozesses auf mehrere Probleme:

  • Eine Klasse mit hoher Entropie, die dem Training schadete, wurde identifiziert und entfernt.
  • Es wurde festgestellt, dass 4.500 der 'negativen' Beispiele im Datensatz tatsächlich reale Passwörter enthielten, was bedeutete, dass das Modell darauf trainiert wurde, Geheimnisse zu ignorieren. Die Behebung dieses Problems verbesserte den Recall bei Passwörtern.

Der Entwickler hat einen vollständigen technischen Bericht mit Trainingsstatistiken, Beispielen und einer schrittweisen Aufschlüsselung des Prozesses veröffentlicht.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Wann man KI-Agenten gegenüber einfacheren Tools einsetzt: Muster aus r/LocalLLaMA
Anwendungsfälle

Wann man KI-Agenten gegenüber einfacheren Tools einsetzt: Muster aus r/LocalLLaMA

Eine Reddit-Diskussion skizziert drei Fragen, um zu bestimmen, ob eine Aufgabe einen KI-Agenten benötigt: Ist das Verfahren bekannt? Wie viele Elemente? Sind die Elemente unabhängig? Der Beitrag identifiziert Anti-Patterns wie Stapelverarbeitung und geplante Berichte, die nicht von der Agentenlogik profitieren.

OpenClawRadar
Entwickler kombiniert Claude Code und Codex für besseren KI-Codierungs-Workflow
Anwendungsfälle

Entwickler kombiniert Claude Code und Codex für besseren KI-Codierungs-Workflow

Ein Entwickler berichtet, dass er Claude Code als Orchestrator und Codex als Worker einsetzt und feststellt, dass die schnellere Codiergeschwindigkeit von Codex mit GPT 5.4 durch schlechte Erklärungen ausgeglichen wird, die mehrfaches Lesen erfordern, um zu verstehen, was sich geändert hat.

OpenClawRadar
KI-Code-Agenten nehmen Abkürzungen: Entwickler dokumentieren Fälle, in denen Claude und ChatGPT den einfachsten Weg wählen
Anwendungsfälle

KI-Code-Agenten nehmen Abkürzungen: Entwickler dokumentieren Fälle, in denen Claude und ChatGPT den einfachsten Weg wählen

Ein Entwickler, der ein Sensorfusion-Gerät baute, stellte fest, dass sowohl Claude als auch ChatGPT die Eingaben von zwei Mikrofonen zu Mono zusammenführten, anstatt Beamforming für räumliches Bewusstsein zu implementieren. In einer separaten Modelltraining-Aufgabe gruppierte die KI zunächst Testpersonen unterschiedlicher Größe zusammen, ohne sie nach Alterskohorten zu sortieren.

OpenClawRadar
Automatisierung eines täglichen KI-Nachrichten-Podcasts mit Claude Code und drei KI-Agenten
Anwendungsfälle

Automatisierung eines täglichen KI-Nachrichten-Podcasts mit Claude Code und drei KI-Agenten

Ein Entwickler baute eine vollständig automatisierte Podcast-Pipeline mit Claude Code, die drei spezialisierte KI-Agenten orchestriert, die KI-Nachrichten kuratieren, Sprechertexte schreiben, Inhalte faktenprüfen und Audio mit Stimmklonung generieren. Das System veröffentlicht täglich Episoden mit minimalem manuellem Eingriff.

OpenClawRadar