Интерфейс и сервер для автоэнкодеров естественного языка Anthropic на llama.cpp

✍️ OpenClawRadar📅 Опубликовано: 13 мая 2026 г.🔗 Source
Ad

Первые модели с открытым весом от Anthropic — Natural Language Autoencoders (NLA) — представляют собой дообучения популярных архитектур с открытым весом. Поскольку они не изменяют базовую архитектуру модели или код моделирования, инференс с llama.cpp не представляет сложности. Разработчик упаковал все функции NLA — извлечение активаций, объяснение активаций, реконструкцию активаций и управление через редактирование объяснений — в пользовательский сервер llama.cpp, объединённый с интерфейсом Mikupad для объяснения и управления активациями на уровне токенов.

Ключевые особенности

  • Извлечение активаций: Извлечение внутренних активаций из любого слоя базовой модели.
  • Объяснение активаций: Получение читаемых человеком объяснений для извлечённых активаций.
  • Реконструкция активаций: Восстановление активаций из их объяснений.
  • Управление через редактирование объяснений: Изменение объяснений и соответствующее управление выводом модели.
Ad

Технические детали

Сервер построен на основе llama.cpp и требует одновременной загрузки трёх моделей: базовой модели, модели актора и модели критика. Это ресурсоёмкая конфигурация. Разработчик работает над версией на основе LoRA, которая позволит загружать одну модель в память, значительно снизив потребление ресурсов.

Интерфейс Mikupad предоставляет интерфейс на уровне токенов для объяснения и управления активациями. Вы можете просматривать, какие токены активируют определённые признаки, и корректировать поведение модели, редактируя объяснения в реальном времени.

Начало работы

Исходный код и инструкции по настройке доступны на Reddit. В настоящее время необходимо иметь три контрольные точки модели NLA (базовая, актор, критик) и скомпилировать пользовательский сервер llama.cpp. Версия на LoRA ожидается в ближайшее время.

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Инструменты CLI с совместимостью с AI-агентами: подход через каталог навыков
Инструменты

Инструменты CLI с совместимостью с AI-агентами: подход через каталог навыков

Пользователь Reddit делится методом обеспечения совместимости CLI-инструментов с ИИ-агентами для программирования, такими как Claude Code, путем создания SKILL.md файлов, которые обучают агентов установке, аутентификации и использованию. Этот подход решает распространённые проблемы, такие как интерактивные запросы, вывод JSON и методы аутентификации.

OpenClawRadar
Claude Code LSP: Включение протокола языкового сервера для более быстрой и точной навигации по коду
Инструменты

Claude Code LSP: Включение протокола языкового сервера для более быстрой и точной навигации по коду

Claude Code поставляется без включенного LSP по умолчанию, но его активация преобразует навигацию по коду из 30-60-секундных поисков через grep в 50-миллисекундные запросы со 100% точностью. Настройка требует флага, обнаруженного через issue на GitHub, а не через официальную документацию.

OpenClawRadar
Интерактивная интеллект-карта визуализирует экосистему инструментов Claude
Инструменты

Интерактивная интеллект-карта визуализирует экосистему инструментов Claude

Разработчик создал интерактивную HTML-карту мыслей с использованием D3.js для отслеживания функций в инструментах Claude: Chat, Cowork и Code, включая доступность на платформах, различия в ценах и совместимость коннекторов.

OpenClawRadar
AI Token Monitor: Инструмент для macOS отслеживает локальное использование Claude и расходы
Инструменты

AI Token Monitor: Инструмент для macOS отслеживает локальное использование Claude и расходы

Разработчик создал AI Token Monitor — приложение для строки меню macOS, которое читает локальные файлы сессий Claude для отслеживания использования токенов, распределения моделей и эквивалентов стоимости без API-ключей. Инструмент с открытым исходным кодом показал 6,5 млн токенов (4 924 доллара по ценам API) за 35 дней в случае одного пользователя.

OpenClawRadar