Pruebas de δ-Mem en Apple Silicon: Implementación MLX y Benchmarks

✍️ OpenClawRadar📅 Publicado: 16 de mayo de 2026🔗 Source

Un usuario de Reddit implementó el artículo de investigación δ-mem (arXiv 2605.12357) para Apple Silicon usando mlx e integración con OpenClaw. El artículo mejora la dirección de la atención del modelo sin contexto ni LoRA, reportando un 20% mejores respuestas en sus pruebas. La implementación usó Qwen3-4B-Instruct via mlx y adaptadores personalizados.

Resultados de benchmarks (pruebas mlx normalizadas, Qwen3-4B-Instruct en MacMini 64GB):

Estilo artículo sintético: Plain 0.5129, δ-mem 0.5129 (1.00x)
LoCoMo-10 mini: Plain 0.0500, δ-mem 0.1833 (3.67x)
OpenClaw replay: Plain 0.5701, δ-mem 0.6667 (1.17x)

Costos de latencia (vs plain):

Sintético: 1.013x
LoCoMo-10 mini: 1.33x consulta / 1.50x total
OpenClaw replay: 1.30x

Enlaces clave:

Repositorio de GitHub con el adaptador: delta-mem-mlx-sidecar-w-openclaw
Adaptador MLX en Hugging Face: delta-mem-qwen3-4b-instruct-mlx-adapter

Conclusiones:

Las pruebas sintéticas fueron planas (1.00x), pero LoCoMo-mini mostró fuertes ganancias relativas (3.67x).
El replay estilo OpenClaw mostró una mejora prácticamente significativa (6/8 → 7/8 pruebas superadas, 1.17x).
El usuario señala que Apple Silicon no puede ejecutar CUDA eficientemente, por lo que los resultados son inferiores a los benchmarks del artículo. Los benchmarks del artículo (Qwen3-4B-Instruct) mostraron un promedio de 1.10x vs backbone congelado, MemoryAgentBench 1.31x, LoCoMo 1.20x.
El usuario busca ayuda (o financiamiento ~$6k) para entrenar un adaptador para modelos más grandes como Qwen3.6:27B.

Para quién es: Desarrolladores que ejecutan agentes LLM locales en Apple Silicon y quieren experimentar con la modulación de pesos δ-mem para mejorar el rendimiento de memoria/contexto.

📖 Lee la fuente completa: r/LocalLLaMA

👀 Ver también

Herramientas

Fábrica de Agentes: Sistema Autónomo Construye Agentes de IA a partir de Discusiones de Problemas en Línea

Agent Factory es un sistema autónomo que extrae datos de Reddit, HN, GitHub y Twitter en busca de problemas reales, los evalúa según la demanda, la brecha de mercado y la viabilidad, y luego construye agentes de IA independientes para las ideas más prometedoras. El sistema utiliza una plantilla mínima de Next.js con 7 herramientas y ejecuta Claude Code sin interfaz gráfica mediante un script de shell.

16 abr 2026, 01:45 UTC

OpenClawRadar

Herramientas

NVIDIA anuncia la plataforma de agentes NemoClaw con controles de privacidad.

NVIDIA ha lanzado NemoClaw, una plataforma de agentes que permite a los usuarios instalar modelos Nimotron y el entorno de ejecución Open Shell con un solo comando, además de añadir controles de privacidad y seguridad para agentes autónomos.

21 mar 2026, 01:45 UTC

OpenClawRadar

Herramientas

iknowkungfu Analizador de Habilidades Examina el Uso de OpenClaw para Recomendar Habilidades Faltantes

iknowkungfu es una nueva habilidad de OpenClaw que escanea el espacio de trabajo, archivos de memoria y registros de conversación de tu agente para identificar qué habilidades te faltan según tus patrones de uso reales. Proporciona recomendaciones específicas con puntuaciones de confianza y razones vinculadas a tu flujo de trabajo.

25 mar 2026, 21:45 UTC

OpenClawRadar

Herramientas

FFF - Fast File Finder afirma tener una ventaja de velocidad 100 veces mayor que ripgrep.

FFF (Fast File Finder) es una herramienta de búsqueda de archivos basada en web que afirma ser 100 veces más rápida que ripgrep, posicionándose como una alternativa de próxima generación a los métodos de búsqueda basados en expresiones regulares. La herramienta requiere JavaScript para funcionar y fue recientemente discutida en Hacker News con 36 puntos y 17 comentarios.

4 abr 2026, 12:45 UTC

OpenClawRadar