DeepSeek-V4-Flash делает управление LLM практичным для локальных моделей

✍️ OpenClawRadar📅 Опубликовано: 16 мая 2026 г.🔗 Source
DeepSeek-V4-Flash делает управление LLM практичным для локальных моделей
Ad

В своей последней статье Шин Гёдекс утверждает, что DeepSeek-V4-Flash меняет правила игры в управлении LLM — технике манипуляции активациями модели во время вывода для направления выходных данных. Ключевым фактором является DwarfStar — урезанный форк llama.cpp от antirez, который запускает только DeepSeek-V4-Flash и встраивает управление как функцию первого класса.

Что такое управление?

Управление извлекает концепцию (например, "отвечай кратко") из внутренних активаций модели. Один из методов: подайте сотню подсказок дважды — один раз обычным образом, другой раз с добавлением "отвечай кратко" — затем вычтите матрицы активаций, чтобы получить вектор управления. Добавьте этот вектор к активациям любой подсказки, и модель станет краткой. Более продвинутый подход использует разреженные автоэнкодеры (как у Anthropic) для изучения паттернов признаков, но это дороже.

Почему это важно

Управление обещает прямой контроль над поведением модели без инженерии подсказок. Вместо написания ограничителей вроде "вы ОБЯЗАНЫ" у вас будет ползунок для краткости или добросовестности. Это также увлекательно с точки зрения интерпретируемости — вспомните одержимость Golden Gate Claude, но настраиваемую вами.

Ad

Почему не раньше?

Управление было идеей среднего класса: слишком грубой для крупных лабораторий (они просто переобучают модель) и недоступной для пользователей API (нет доступа к весам или активациям). Модели с открытыми весами были слишком слабы, чтобы с ними возиться — до DeepSeek-V4-Flash, который достаточно силен для агентного программирования. Даже в этом случае подсказки часто превосходят управление для простых качеств, таких как многословность; настоящий выигрыш — управление неподдающейся подсказкам концепцией, такой как интеллект.

Гёдекс планирует внимательно следить за DwarfStar. На момент написания его поддержка управления rudimentary (просто переключатель многословности, похожий на подсказки), но релиз был всего восемь дней назад.

📖 Источник: HN LLM Tools

Ad

👀 Смотрите также

Опыт разработчика с ИИ Claude: от партнера по размышлениям до когнитивного аутсорсинга
Новости

Опыт разработчика с ИИ Claude: от партнера по размышлениям до когнитивного аутсорсинга

Разработчик делится 8-месячным опытом ежедневного использования Claude AI, отмечая переход от использования ИИ для улучшения собственных мыслей к полному аутсорсингу начального мышления. В посте описываются два различных когнитивных подхода: ИИ как партнёр по мышлению против ИИ как генератора первого наброска.

OpenClawRadar
Agent SDK против Claude CLI: взгляд пользователя на практические различия
Новости

Agent SDK против Claude CLI: взгляд пользователя на практические различия

Пользователь Reddit задается вопросом о практической разнице между новым Agent SDK для Claude и использованием Claude CLI для локального подключения Opus 4.7.

OpenClawRadar
Выпуск Claude Code версии 2.1.77: Лимиты токенов, управление песочницей и исправления ошибок
Новости

Выпуск Claude Code версии 2.1.77: Лимиты токенов, управление песочницей и исправления ошибок

Claude Code v2.1.77 увеличивает стандартные максимальные лимиты токенов вывода для Claude Opus 4.6 до 64 тысяч токенов и добавляет настройку песочницы allowRead для файловой системы. В релиз включено более 30 исправлений проблем, начиная от управления памятью до поведения терминального интерфейса.

OpenClawRadar
Утечка исходного кода CLI Claude Code раскрывает скрытые функции и внутренние флаги.
Новости

Утечка исходного кода CLI Claude Code раскрывает скрытые функции и внутренние флаги.

Анализ утекшего исходного кода TypeScript для Claude Code CLI выявил 35 флагов функций, активируемых при сборке, включая AI-питомцев BUDDY, постоянную память KAIROS, удалённое планирование ULTRAPLAN и режим координатора. Также обнаружено более 120 недокументированных переменных окружения и 26 внутренних слеш-команд.

OpenClawRadar