El Ajuste Local de Llama 3.2-1B para la Detección de Secretos Supera al Modelo de Wiz

Un desarrollador ha documentado su exitoso ajuste fino local de Llama 3.2-1B para la detección de secretos en código, superando las métricas de un modelo similar de Wiz. El proyecto se realizó completamente con herramientas de IA locales, evitando APIs propietarias.
Resultados clave y enfoque
El desarrollador buscaba replicar o superar los resultados de Wiz de 86% de precisión y 82% de recuperación. Después de algunos fines de semana de trabajo, logró simultáneamente 88% de precisión y 84.4% de recuperación con un modelo Llama 3.2-1B ajustado. También evaluó los modelos Qwen 3.5-2B y 4B, que superaron al modelo de 1B a costa de un mayor uso de VRAM y tiempos de inferencia más largos.
Conjunto de datos y proceso de entrenamiento
El trabajo se basó únicamente en datos disponibles públicamente, que eran insuficientes, por lo que se utilizó generación procedural para aumentar y mejorar el conjunto de datos. Todo el etiquetado se realizó localmente utilizando el modelo Qwen3-Coder-Next. Un objetivo clave del entrenamiento era que los modelos generaran JSON estructurado. Inicialmente, los modelos sin entrenar (Llama y Qwen) obtuvieron un 0% en cumplimiento del esquema, pero después del entrenamiento, esto mejoró al 98-100%.
Desafíos y aprendizajes
El desarrollador encontró varios problemas durante el proceso:
- Incluyó una clase de alta entropía que fue perjudicial para el entrenamiento; esta fue identificada y eliminada.
- Descubrió que 4,500 de las muestras 'negativas' en el conjunto de datos realmente contenían contraseñas del mundo real, lo que significaba que el modelo estaba siendo entrenado para ignorar secretos. Corregir esto mejoró la recuperación de contraseñas.
El desarrollador ha publicado un informe técnico completo con estadísticas de entrenamiento, ejemplos y un desglose paso a paso del proceso.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Ejecutando Agentes de LLM Locales en Mac Minis con Interfaz de Telegram
Un desarrollador comparte una configuración que utiliza 5 agentes de LLM locales en Mac Minis, controlados mediante bots de Telegram sin costos de API. El sistema emplea LMStudio para servir modelos, sesiones de tmux para Claude Code y 80 líneas de Python para el puente con Telegram.

Arquitectura de Contrato de Guión y Expansión de Investigación para un Pipeline de Producción de Video Multiagente con Claude
Un pipeline multiagente que usa Claude para producir videos educativos de YouTube de 15 a 20 minutos a partir de un tema y una personalidad. Cuenta con una arquitectura de contrato narrativo para la coherencia entre capítulos y un despliegue paralelo de investigación con eliminación competitiva de esquemas.

Estudio de Caso de OpenClaw: Construyendo 4 Productos y Lanzando un Negocio en 3 Semanas
Una persona sin conocimientos de desarrollo utilizó OpenClaw para construir cuatro productos funcionales y lanzar un negocio de instalación de IA en tres semanas. Los proyectos incluyen una plataforma de tutoría de matemáticas con IA, un bot de trading, un SaaS de panel de marketing y una dApp de mercado de predicciones de Solana.

Configuración Local Multi-Agente con vLLM, Claude Code y gpt-oss-120b en Linux
Un desarrollador creó una configuración multiagente paralela 100% local utilizando vLLM en Docker, Claude Code para orquestación apuntando a localhost, y gpt-oss-120b como agente de codificación en una GPU RTX Pro 6000 Blackwell MaxQ con Ubuntu de arranque dual, logrando 8 agentes trabajando concurrentemente.