Локальная тонкая настройка Llama 3.2-1B для обнаружения секретов превосходит модель Wiz.

Разработчик задокументировал успешную локальную дообучку модели Llama 3.2-1B для обнаружения секретов в коде, превзойдя показатели аналогичной модели от Wiz. Проект был выполнен полностью с использованием локальных инструментов ИИ, без обращения к проприетарным API.
Ключевые результаты и подход
Разработчик ставил цель повторить или превзойти результаты Wiz в 86% точности и 82% полноты. После нескольких выходных работы ему удалось одновременно достичь 88% точности и 84,4% полноты с дообученной моделью Llama 3.2-1B. Также были протестированы модели Qwen 3.5-2B и 4B, которые показали лучшие результаты, чем модель на 1B, ценой большего использования видеопамяти и более долгого времени вывода.
Набор данных и процесс обучения
Работа опиралась исключительно на общедоступные данные, которых было недостаточно, поэтому для аугментации и улучшения набора данных использовалась процедурная генерация. Вся разметка выполнялась локально с помощью модели Qwen3-Coder-Next. Ключевой целью обучения было научить модели выводить структурированный JSON. Изначально необученные модели (Llama и Qwen) показывали 0% соответствия схеме, но после обучения этот показатель улучшился до 98-100%.
Трудности и выводы
В процессе разработчик столкнулся с несколькими проблемами:
- Был включён класс с высокой энтропией, который вредил обучению; он был выявлен и удалён.
- Обнаружилось, что 4500 «негативных» примеров в наборе данных на самом деле содержали реальные пароли, что означало, что модель обучалась игнорировать секреты. Исправление этого улучшило полноту обнаружения паролей.
Разработчик опубликовал полное техническое описание со статистикой обучения, примерами и пошаговым разбором процесса.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также
Три разума: структура для совместной работы человека и двух ИИ-агентов
Пользователь Reddit описывает модель совместной работы человека и ИИ с использованием двух агентов Claude с разными контекстами: один для повседневных операций, другой для специальных знаний. Человек задает направление и принимает окончательные решения.

Автоматизация ежедневного подкаста об искусственном интеллекте с помощью Claude Code и трёх AI-агентов
Разработчик создал полностью автоматизированный конвейер для подкастов с использованием Claude Code для координации трех специализированных ИИ-агентов, которые отбирают новости об ИИ, пишут сценарии для озвучки, проверяют факты и генерируют аудио с клонированием голоса. Система публикует ежедневные выпуски с минимальным ручным вмешательством.

Создание пользовательских навыков анализа изображений в OpenClaw с использованием локальных моделей
Разработчик создал пользовательский навык OpenClaw для анализа изображений с использованием Qwen2.5 VL, работающего локально через Ollama на Windows 11 с WSL, обойдя ограничения обработки изображений в веб-интерфейсе с помощью API-вызовов и пользовательских скриптов.

Как агенты ИИ последовательно применяют когнитивные принципы в рабочих процессах разработки
ИИ-агенты могут внедрять четыре уровня когнитивных принципов — эпистемические основы, принципы исполнения, принципы рычагов и системный дизайн — с неумолимой последовательностью в личных, некоммерческих и общественных задачах управления.