Fine-Tuning Llama 3.2-1B pour Détection de Secrets : 88% de Précision

Un développeur a documenté son ajustement fin local réussi de Llama 3.2-1B pour la détection de secrets dans le code, dépassant les métriques d'un modèle similaire de Wiz. Le projet a été mené entièrement avec des outils d'IA locaux, évitant les API propriétaires.

Résultats clés et approche

Le développeur visait à répliquer ou à surpasser les résultats de Wiz de 86 % de précision et 82 % de rappel. Après quelques week-ends de travail, il a atteint 88 % de précision et 84,4 % de rappel simultanément avec un modèle Llama 3.2-1B ajusté finement. Il a également évalué les modèles Qwen 3.5-2B et 4B, qui ont surpassé le modèle 1B au prix d'une utilisation de VRAM plus élevée et de temps d'inférence plus longs.

Ensemble de données et processus d'entraînement

Le travail s'est appuyé uniquement sur des données publiquement disponibles, qui étaient insuffisantes, donc une génération procédurale a été utilisée pour augmenter et améliorer l'ensemble de données. Tout l'étiquetage a été effectué localement en utilisant le modèle Qwen3-Coder-Next. Un objectif d'entraînement clé était que les modèles produisent du JSON structuré. Initialement, les modèles non entraînés (Llama & Qwen) ont obtenu 0 % de conformité au schéma, mais après l'entraînement, cela s'est amélioré à 98-100 %.

Défis et apprentissages

Le développeur a rencontré plusieurs problèmes pendant le processus :

Inclusion d'une classe à haute entropie qui était préjudiciable à l'entraînement ; celle-ci a été identifiée et supprimée.
Découverte que 4 500 des échantillons « négatifs » dans l'ensemble de données contenaient en réalité des mots de passe du monde réel, ce qui signifiait que le modèle était entraîné à ignorer les secrets. Corriger cela a amélioré le rappel sur les mots de passe.

Le développeur a publié un compte rendu technique complet avec des statistiques d'entraînement, des exemples et une analyse étape par étape du processus.

📖 Read the full source: r/LocalLLaMA

Réglage Fin Local de Llama 3.2-1B pour la Détection de Secrets Surpasse le Modèle de Wiz

Résultats clés et approche

Ensemble de données et processus d'entraînement

Défis et apprentissages

👀 See Also

Flux de Travail de Prospection LinkedIn Construit avec Claude pour la Prospection et l'Engagement

Gérer une chaîne d'actualités IA avec Telegram et OpenClaw : un flux de travail complet

Étude de cas : Utilisation de prompts LLM au lieu d'échafaudages programmatiques pour les constructions logicielles multi-agents

L'agent OpenClaw génère des modèles CAO et des fichiers STL à partir de spécifications dimensionnelles.