Локальная тонкая настройка Llama 3.2-1B для обнаружения секретов превосходит модель Wiz.

✍️ OpenClawRadar📅 Опубликовано: 16 апреля 2026 г.🔗 Source
Локальная тонкая настройка Llama 3.2-1B для обнаружения секретов превосходит модель Wiz.
Ad

Разработчик задокументировал успешную локальную дообучку модели Llama 3.2-1B для обнаружения секретов в коде, превзойдя показатели аналогичной модели от Wiz. Проект был выполнен полностью с использованием локальных инструментов ИИ, без обращения к проприетарным API.

Ключевые результаты и подход

Разработчик ставил цель повторить или превзойти результаты Wiz в 86% точности и 82% полноты. После нескольких выходных работы ему удалось одновременно достичь 88% точности и 84,4% полноты с дообученной моделью Llama 3.2-1B. Также были протестированы модели Qwen 3.5-2B и 4B, которые показали лучшие результаты, чем модель на 1B, ценой большего использования видеопамяти и более долгого времени вывода.

Набор данных и процесс обучения

Работа опиралась исключительно на общедоступные данные, которых было недостаточно, поэтому для аугментации и улучшения набора данных использовалась процедурная генерация. Вся разметка выполнялась локально с помощью модели Qwen3-Coder-Next. Ключевой целью обучения было научить модели выводить структурированный JSON. Изначально необученные модели (Llama и Qwen) показывали 0% соответствия схеме, но после обучения этот показатель улучшился до 98-100%.

Ad

Трудности и выводы

В процессе разработчик столкнулся с несколькими проблемами:

  • Был включён класс с высокой энтропией, который вредил обучению; он был выявлен и удалён.
  • Обнаружилось, что 4500 «негативных» примеров в наборе данных на самом деле содержали реальные пароли, что означало, что модель обучалась игнорировать секреты. Исправление этого улучшило полноту обнаружения паролей.

Разработчик опубликовал полное техническое описание со статистикой обучения, примерами и пошаговым разбором процесса.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

🦀
Кейсы

Три разума: структура для совместной работы человека и двух ИИ-агентов

Пользователь Reddit описывает модель совместной работы человека и ИИ с использованием двух агентов Claude с разными контекстами: один для повседневных операций, другой для специальных знаний. Человек задает направление и принимает окончательные решения.

OpenClawRadar
Автоматизация ежедневного подкаста об искусственном интеллекте с помощью Claude Code и трёх AI-агентов
Кейсы

Автоматизация ежедневного подкаста об искусственном интеллекте с помощью Claude Code и трёх AI-агентов

Разработчик создал полностью автоматизированный конвейер для подкастов с использованием Claude Code для координации трех специализированных ИИ-агентов, которые отбирают новости об ИИ, пишут сценарии для озвучки, проверяют факты и генерируют аудио с клонированием голоса. Система публикует ежедневные выпуски с минимальным ручным вмешательством.

OpenClawRadar
Создание пользовательских навыков анализа изображений в OpenClaw с использованием локальных моделей
Кейсы

Создание пользовательских навыков анализа изображений в OpenClaw с использованием локальных моделей

Разработчик создал пользовательский навык OpenClaw для анализа изображений с использованием Qwen2.5 VL, работающего локально через Ollama на Windows 11 с WSL, обойдя ограничения обработки изображений в веб-интерфейсе с помощью API-вызовов и пользовательских скриптов.

OpenClawRadar
Как агенты ИИ последовательно применяют когнитивные принципы в рабочих процессах разработки
Кейсы

Как агенты ИИ последовательно применяют когнитивные принципы в рабочих процессах разработки

ИИ-агенты могут внедрять четыре уровня когнитивных принципов — эпистемические основы, принципы исполнения, принципы рычагов и системный дизайн — с неумолимой последовательностью в личных, некоммерческих и общественных задачах управления.

OpenClawRadar