Ajuste Local Fino do Llama 3.2-1B para Detecção de Segredos Supera o Modelo da Wiz

✍️ OpenClawRadar📅 Publicado: April 16, 2026🔗 Source
Ajuste Local Fino do Llama 3.2-1B para Detecção de Segredos Supera o Modelo da Wiz
Ad

Um desenvolvedor documentou sua bem-sucedida adaptação local do Llama 3.2-1B para detecção de segredos em código, superando as métricas de um modelo similar da Wiz. O projeto foi conduzido inteiramente com ferramentas de IA locais, evitando APIs proprietárias.

Resultados Principais e Abordagem

O desenvolvedor tinha como objetivo replicar ou superar os resultados da Wiz de 86% de precisão e 82% de recall. Após alguns fins de semana de trabalho, eles alcançaram 88% de precisão e 84,4% de recall simultaneamente com um modelo Llama 3.2-1B adaptado. Eles também avaliaram os modelos Qwen 3.5-2B e 4B, que superaram o modelo de 1B ao custo de maior uso de VRAM e tempos de inferência mais longos.

Conjunto de Dados e Processo de Treinamento

O trabalho dependeu exclusivamente de dados publicamente disponíveis, que eram insuficientes, então a geração procedural foi usada para aumentar e melhorar o conjunto de dados. Toda a rotulagem foi feita localmente usando o modelo Qwen3-Coder-Next. Um objetivo de treinamento fundamental era fazer com que os modelos gerassem JSON estruturado. Inicialmente, modelos não treinados (Llama e Qwen) tiveram pontuação de 0% em conformidade com o esquema, mas após o treinamento, isso melhorou para 98-100%.

Ad

Desafios e Aprendizados

O desenvolvedor encontrou vários problemas durante o processo:

  • Incluiu uma classe de alta entropia que foi prejudicial ao treinamento; isso foi identificado e removido.
  • Descobriu que 4.500 das amostras 'negativas' no conjunto de dados realmente continham senhas do mundo real, o que significa que o modelo estava sendo treinado para ignorar segredos. Corrigir isso melhorou o recall em senhas.

O desenvolvedor publicou um relatório técnico completo com estatísticas de treinamento, exemplos e uma explicação passo a passo do processo.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Detalhes do desenvolvedor sobre a configuração do Claude para gerenciamento de projetos e acompanhamento de tarefas
Use Cases

Detalhes do desenvolvedor sobre a configuração do Claude para gerenciamento de projetos e acompanhamento de tarefas

Um desenvolvedor compartilha sua implementação do Claude para gerenciar um novo trabalho em mídia no regime home office, incluindo um arquivo mestre de projeto em markdown, integração com Notion, conexões MCP para Slack, Gmail e Google Calendar, e uma habilidade personalizada para briefings matinais.

OpenClawRadar
Agentes de IA Gerenciando um Negócio Real de E-commerce: Insights Práticos de uma Implementação
Use Cases

Agentes de IA Gerenciando um Negócio Real de E-commerce: Insights Práticos de uma Implementação

Um sistema de agente de IA opera uma loja de comércio eletrônico real, lidando com design, programação, marketing e operações de atendimento ao cliente sem execução de tarefas humanas. A implementação revela que decisões de julgamento, como limites de rejeição de design e priorização de incidentes, apresentam desafios mais difíceis do que a coordenação técnica dos agentes.

OpenClawRadar
Não programador cria baixador de vídeos local com Claude AI em uma noite
Use Cases

Não programador cria baixador de vídeos local com Claude AI em uma noite

Um usuário sem conhecimento de programação usou a Claude AI para criar o AZ Downloader, um downloader de vídeos local que funciona em 14/16 plataformas, incluindo YouTube, TikTok, Instagram e Reddit. A ferramenta foi criada em uma noite e agora está disponível no GitHub.

OpenClawRadar
Desenvolvedor cria aplicativo de desktop em Python com 3.106 linhas usando Claude Code em 3 semanas, sem experiência prévia em programação
Use Cases

Desenvolvedor cria aplicativo de desktop em Python com 3.106 linhas usando Claude Code em 3 semanas, sem experiência prévia em programação

Um desenvolvedor sem conhecimento prévio de Python construiu um aplicativo desktop com 3.106 linhas em três semanas usando Claude Code, descrevendo funcionalidades seção por seção através de uma conversa com mais de 500.000 caracteres. O aplicativo lida com obtenção de conteúdo, registro, acompanhamento de métricas, pesquisa, marcos gamificados e acionamento remoto de um telefone.

OpenClawRadar