Интерфейс и сервер для автоэнкодеров естественного языка Anthropic на llama.cpp
Первые модели с открытым весом от Anthropic — Natural Language Autoencoders (NLA) — представляют собой дообучения популярных архитектур с открытым весом. Поскольку они не изменяют базовую архитектуру модели или код моделирования, инференс с llama.cpp не представляет сложности. Разработчик упаковал все функции NLA — извлечение активаций, объяснение активаций, реконструкцию активаций и управление через редактирование объяснений — в пользовательский сервер llama.cpp, объединённый с интерфейсом Mikupad для объяснения и управления активациями на уровне токенов.
Ключевые особенности
- Извлечение активаций: Извлечение внутренних активаций из любого слоя базовой модели.
- Объяснение активаций: Получение читаемых человеком объяснений для извлечённых активаций.
- Реконструкция активаций: Восстановление активаций из их объяснений.
- Управление через редактирование объяснений: Изменение объяснений и соответствующее управление выводом модели.
Технические детали
Сервер построен на основе llama.cpp и требует одновременной загрузки трёх моделей: базовой модели, модели актора и модели критика. Это ресурсоёмкая конфигурация. Разработчик работает над версией на основе LoRA, которая позволит загружать одну модель в память, значительно снизив потребление ресурсов.
Интерфейс Mikupad предоставляет интерфейс на уровне токенов для объяснения и управления активациями. Вы можете просматривать, какие токены активируют определённые признаки, и корректировать поведение модели, редактируя объяснения в реальном времени.
Начало работы
Исходный код и инструкции по настройке доступны на Reddit. В настоящее время необходимо иметь три контрольные точки модели NLA (базовая, актор, критик) и скомпилировать пользовательский сервер llama.cpp. Версия на LoRA ожидается в ближайшее время.
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Инструменты CLI с совместимостью с AI-агентами: подход через каталог навыков
Пользователь Reddit делится методом обеспечения совместимости CLI-инструментов с ИИ-агентами для программирования, такими как Claude Code, путем создания SKILL.md файлов, которые обучают агентов установке, аутентификации и использованию. Этот подход решает распространённые проблемы, такие как интерактивные запросы, вывод JSON и методы аутентификации.

Claude Code LSP: Включение протокола языкового сервера для более быстрой и точной навигации по коду
Claude Code поставляется без включенного LSP по умолчанию, но его активация преобразует навигацию по коду из 30-60-секундных поисков через grep в 50-миллисекундные запросы со 100% точностью. Настройка требует флага, обнаруженного через issue на GitHub, а не через официальную документацию.

Интерактивная интеллект-карта визуализирует экосистему инструментов Claude
Разработчик создал интерактивную HTML-карту мыслей с использованием D3.js для отслеживания функций в инструментах Claude: Chat, Cowork и Code, включая доступность на платформах, различия в ценах и совместимость коннекторов.

AI Token Monitor: Инструмент для macOS отслеживает локальное использование Claude и расходы
Разработчик создал AI Token Monitor — приложение для строки меню macOS, которое читает локальные файлы сессий Claude для отслеживания использования токенов, распределения моделей и эквивалентов стоимости без API-ключей. Инструмент с открытым исходным кодом показал 6,5 млн токенов (4 924 доллара по ценам API) за 35 дней в случае одного пользователя.