Testando δ-Mem no Apple Silicon: Implementação MLX e Benchmarks

✍️ OpenClawRadar📅 Publicado: May 16, 2026🔗 Source

Um usuário do Reddit implementou o artigo de pesquisa δ-mem (arXiv 2605.12357) para Apple Silicon usando mlx e integração OpenClaw. O artigo melhora a direção da atenção do modelo sem contexto ou LoRA, relatando respostas 20% melhores em seus testes. A implementação usou Qwen3-4B-Instruct via mlx e adaptadores personalizados.

Resultados dos Benchmarks (testes mlx normalizados, Qwen3-4B-Instruct em MacMini 64GB):

Estilo sintético do artigo: Plain 0,5129, δ-mem 0,5129 (1,00x)
LoCoMo-10 mini: Plain 0,0500, δ-mem 0,1833 (3,67x)
Replay OpenClaw: Plain 0,5701, δ-mem 0,6667 (1,17x)

Custos de latência (vs plain):

Sintético: 1,013x
LoCoMo-10 mini: 1,33x query / 1,50x total
Replay OpenClaw: 1,30x

Links importantes:

Repositório GitHub com adaptador: delta-mem-mlx-sidecar-w-openclaw
Adaptador MLX no Hugging Face: delta-mem-qwen3-4b-instruct-mlx-adapter

Conclusões:

As sondas sintéticas ficaram planas (1,00x), mas o LoCoMo-mini mostrou fortes ganhos relativos (3,67x).
O replay estilo OpenClaw mostrou uma melhoria praticamente significativa (6/8 → 7/8 sondas aprovadas, 1,17x).
O usuário observa que o Apple Silicon não pode executar CUDA eficientemente, então os resultados são inferiores aos benchmarks do artigo. Os benchmarks do artigo (Qwen3-4B-Instruct) mostraram média de 1,10x vs backbone congelado, MemoryAgentBench 1,31x, LoCoMo 1,20x.
O usuário está pedindo ajuda (ou financiamento de ~$6k) para treinar um adaptador para modelos maiores, como Qwen3.6:27B.

Para quem é: Desenvolvedores executando agentes LLM locais em Apple Silicon que desejam experimentar a modulação de peso δ-mem para melhorar o desempenho de memória/contexto.

📖 Leia a fonte completa: r/LocalLLaMA

👀 See Also

Tools

Análise de ações em tempo real adicionada ao Claude Desktop via servidor MCP

Um desenvolvedor criou um servidor MCP chamado agent-toolbelt que adiciona capacidades de análise de ações em tempo real ao Claude Desktop e Claude Code. A ferramenta fornece cinco funções de análise específicas e funciona com uma instalação de comando único.

Mar 21, 2026, 05:45 AM UTC

OpenClawRadar

Tools

Servidor MCP de Análise First Claude: Dando Acesso Direto a Agentes de IA ao Contexto de Análise Web

Um desenvolvedor reconstruiu sua ferramenta de análise web como um servidor MCP, expondo análises web simples, links rastreáveis e ferramentas de insight de produto diretamente ao Claude, permitindo que agentes de IA aproveitem dados do site junto com contexto de código e banco de dados.

May 15, 2026, 12:18 PM UTC

OpenClawRadar

Tools

Visão Comparativa da Inferência Rápida de LLMs pela Anthropic e OpenAI

Anthropic e OpenAI lançaram recursos distintos de 'modo rápido' para inferência mais rápida de LLM, com a OpenAI utilizando chips Cerebras para maior velocidade

Feb 15, 2026, 01:45 PM UTC

OpenClawRadar

Tools

LLM-Memory.net: Sistema de Memória de Código Aberto com Infraestrutura Multi-Agente

LLM-Memory.net é um sistema de memória auto-hospedável para agentes de IA que fornece armazenamento de notas com busca semântica, comunicação em tempo real via chat/e-mail entre agentes, discussões estruturadas com votação e integração com servidor MCP. O código-fonte completo está disponível no GitHub com instalador e playbooks Ansible.

Apr 15, 2026, 04:45 PM UTC

OpenClawRadar