El Ajuste Local de Llama 3.2-1B para la Detección de Secretos Supera al Modelo de Wiz

✍️ OpenClawRadar📅 Publicado: 16 de abril de 2026🔗 Source
El Ajuste Local de Llama 3.2-1B para la Detección de Secretos Supera al Modelo de Wiz
Ad

Un desarrollador ha documentado su exitoso ajuste fino local de Llama 3.2-1B para la detección de secretos en código, superando las métricas de un modelo similar de Wiz. El proyecto se realizó completamente con herramientas de IA locales, evitando APIs propietarias.

Resultados clave y enfoque

El desarrollador buscaba replicar o superar los resultados de Wiz de 86% de precisión y 82% de recuperación. Después de algunos fines de semana de trabajo, logró simultáneamente 88% de precisión y 84.4% de recuperación con un modelo Llama 3.2-1B ajustado. También evaluó los modelos Qwen 3.5-2B y 4B, que superaron al modelo de 1B a costa de un mayor uso de VRAM y tiempos de inferencia más largos.

Conjunto de datos y proceso de entrenamiento

El trabajo se basó únicamente en datos disponibles públicamente, que eran insuficientes, por lo que se utilizó generación procedural para aumentar y mejorar el conjunto de datos. Todo el etiquetado se realizó localmente utilizando el modelo Qwen3-Coder-Next. Un objetivo clave del entrenamiento era que los modelos generaran JSON estructurado. Inicialmente, los modelos sin entrenar (Llama y Qwen) obtuvieron un 0% en cumplimiento del esquema, pero después del entrenamiento, esto mejoró al 98-100%.

Ad

Desafíos y aprendizajes

El desarrollador encontró varios problemas durante el proceso:

  • Incluyó una clase de alta entropía que fue perjudicial para el entrenamiento; esta fue identificada y eliminada.
  • Descubrió que 4,500 de las muestras 'negativas' en el conjunto de datos realmente contenían contraseñas del mundo real, lo que significaba que el modelo estaba siendo entrenado para ignorar secretos. Corregir esto mejoró la recuperación de contraseñas.

El desarrollador ha publicado un informe técnico completo con estadísticas de entrenamiento, ejemplos y un desglose paso a paso del proceso.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Ejecutando Agentes de LLM Locales en Mac Minis con Interfaz de Telegram
Casos de uso

Ejecutando Agentes de LLM Locales en Mac Minis con Interfaz de Telegram

Un desarrollador comparte una configuración que utiliza 5 agentes de LLM locales en Mac Minis, controlados mediante bots de Telegram sin costos de API. El sistema emplea LMStudio para servir modelos, sesiones de tmux para Claude Code y 80 líneas de Python para el puente con Telegram.

OpenClawRadar
Arquitectura de Contrato de Guión y Expansión de Investigación para un Pipeline de Producción de Video Multiagente con Claude
Casos de uso

Arquitectura de Contrato de Guión y Expansión de Investigación para un Pipeline de Producción de Video Multiagente con Claude

Un pipeline multiagente que usa Claude para producir videos educativos de YouTube de 15 a 20 minutos a partir de un tema y una personalidad. Cuenta con una arquitectura de contrato narrativo para la coherencia entre capítulos y un despliegue paralelo de investigación con eliminación competitiva de esquemas.

OpenClawRadar
Estudio de Caso de OpenClaw: Construyendo 4 Productos y Lanzando un Negocio en 3 Semanas
Casos de uso

Estudio de Caso de OpenClaw: Construyendo 4 Productos y Lanzando un Negocio en 3 Semanas

Una persona sin conocimientos de desarrollo utilizó OpenClaw para construir cuatro productos funcionales y lanzar un negocio de instalación de IA en tres semanas. Los proyectos incluyen una plataforma de tutoría de matemáticas con IA, un bot de trading, un SaaS de panel de marketing y una dApp de mercado de predicciones de Solana.

OpenClawRadar
Configuración Local Multi-Agente con vLLM, Claude Code y gpt-oss-120b en Linux
Casos de uso

Configuración Local Multi-Agente con vLLM, Claude Code y gpt-oss-120b en Linux

Un desarrollador creó una configuración multiagente paralela 100% local utilizando vLLM en Docker, Claude Code para orquestación apuntando a localhost, y gpt-oss-120b como agente de codificación en una GPU RTX Pro 6000 Blackwell MaxQ con Ubuntu de arranque dual, logrando 8 agentes trabajando concurrentemente.

OpenClawRadar