UI y Servidor para Autoencoders de Lenguaje Natural de Anthropic en llama.cpp

✍️ OpenClawRadar📅 Publicado: 13 de mayo de 2026🔗 Source
Ad

Los primeros modelos de peso abierto de Anthropic, los Autoencoders de Lenguaje Natural (NLAs), son ajustes finos de arquitecturas populares de peso abierto. Debido a que no modifican la arquitectura subyacente del modelo ni el código de modelado, la inferencia con llama.cpp es sencilla. Un desarrollador ha empaquetado todas las funciones de NLA (extracción de activaciones, explicación de activaciones, reconstrucción de activaciones y dirección mediante edición de explicaciones) en un servidor personalizado de llama.cpp, junto con una interfaz Mikupad para la explicación y dirección de activaciones a nivel de token.

Características clave

  • Extracción de activaciones: Extrae activaciones internas de cualquier capa del modelo base.
  • Explicación de activaciones: Obtén explicaciones legibles para humanos de las activaciones extraídas.
  • Reconstrucción de activaciones: Reconstruye activaciones a partir de sus explicaciones.
  • Dirección mediante edición de explicaciones: Modifica explicaciones y dirige la salida del modelo en consecuencia.
Ad

Detalles técnicos

El servidor está construido sobre llama.cpp y requiere que se carguen tres modelos simultáneamente: el modelo base, el modelo actor y el modelo crítico. Esta es una configuración intensiva en memoria. El desarrollador está trabajando en una versión basada en LoRA que permitiría cargar un solo modelo en la memoria, reduciendo significativamente el espacio requerido.

La interfaz Mikupad proporciona una interfaz a nivel de token para la explicación y dirección de activaciones. Puedes inspeccionar qué tokens activan ciertas características y ajustar el comportamiento del modelo editando explicaciones en tiempo real.

Cómo empezar

El código fuente y las instrucciones de configuración están disponibles en Reddit. Actualmente, debes tener los tres puntos de control del modelo NLA (base, actor, crítico) y compilar el servidor personalizado de llama.cpp. La versión LoRA está próxima a lanzarse.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Depurando la lógica de verificación de compilación de Claude Code: Por qué falla la búsqueda de nombres y la búsqueda de huella estructural lo soluciona
Herramientas

Depurando la lógica de verificación de compilación de Claude Code: Por qué falla la búsqueda de nombres y la búsqueda de huella estructural lo soluciona

Claude Code le dijo a un usuario que 'la función no está construida' cuatro veces en una misma sesión, todas incorrectas. La solución: reemplazar la búsqueda por nombre con la búsqueda por huella estructural (rutas, esquemas, herramientas registradas). Se comparte una regla práctica.

OpenClawRadar
Servidor MCP para Archivos Locales de Mapas Mentales XMind Lanzado
Herramientas

Servidor MCP para Archivos Locales de Mapas Mentales XMind Lanzado

Un desarrollador ha publicado un servidor MCP que proporciona 22 herramientas para leer y escribir archivos locales de mapas mentales XMind. El servidor funciona con clientes de IA compatibles con MCP como Claude Desktop y Cursor.

OpenClawRadar
FOMOE Permite la Inferencia del Modelo Qwen3.5 de 397B en Hardware de Escritorio de $2,100
Herramientas

FOMOE Permite la Inferencia del Modelo Qwen3.5 de 397B en Hardware de Escritorio de $2,100

FOMOE (Fast Opportunistic Mixture of Experts) permite ejecutar el modelo insignia de Qwen3.5 de 397 mil millones de parámetros a 5-9 tokens/segundo en hardware de consumo utilizando dos GPU de $500, 32GB de RAM y una unidad NVMe con cuantización Q4_K_M.

OpenClawRadar
Semble: Un servidor MCP local para Claude Code con una reducción del 98% en tokens
Herramientas

Semble: Un servidor MCP local para Claude Code con una reducción del 98% en tokens

Semble es un servidor MCP de código abierto para Claude Code que reemplaza los flujos de trabajo basados en grep+read, utilizando embeddings, BM25 y reranking para reducir el uso de tokens en aproximadamente un 98% mientras indexa repositorios en unos 250ms.

OpenClawRadar