agentmemory V4 atinge 96,2% no benchmark LongMemEval, superando sistemas comerciais de memória de IA

✍️ OpenClawRadar📅 Publicado: March 27, 2026🔗 Source
agentmemory V4 atinge 96,2% no benchmark LongMemEval, superando sistemas comerciais de memória de IA
Ad

O agentmemory V4 é um sistema de memória de código aberto para agentes de IA que acabou de alcançar uma pontuação recorde mundial de 96,2% no LongMemEval, o benchmark padrão para memória de longo prazo de agentes de IA.

Desempenho no Benchmark

O sistema superou várias empresas de memória de IA financiadas:

  • PwC Chronos: 95,6%
  • Mastra: 94,87%
  • OMEGA: 93,2% (bruto)
  • Supermemory: 85,86%
  • Emergence AI: 86%
  • Zep: 71,2%

Detalhes do Desenvolvimento

Desenvolvido por uma única pessoa em 16 dias em um PC gamer de médio porte (i3-12100F) com um custo total de US$ 1.000. O sistema usa o Claude Opus como gerador e o GPT-4o como avaliador, mas a arquitetura de recuperação é a principal inovação.

Ad

Arquitetura Técnica

O sistema combina várias técnicas de recuperação em um único sistema baseado em SQLite:

  • HNSW (Hierarchical Navigable Small World) para busca aproximada do vizinho mais próximo
  • BM25 para recuperação de texto tradicional
  • Cross-encoder para pontuação de relevância
  • Integração de grafo de conhecimento
  • Fundamentação temporal para recuperação de memória consciente do tempo

Disponibilidade

O sistema é de código aberto sob a licença MIT e está disponível em: github.com/JordanMcCann/agentmemory

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Stagent: Camada de operações de código aberto para o Claude Agent SDK com governança local e orquestração de fluxos de trabalho
Tools

Stagent: Camada de operações de código aberto para o Claude Agent SDK com governança local e orquestração de fluxos de trabalho

Stagent é um espaço de trabalho de coordenação local-first e de código aberto construído sobre o Claude Agent SDK e a API Claude que fornece orquestração de fluxos de trabalho, guardrails de orçamento e governança com intervenção humana para agentes de IA. Inclui 15 superfícies de produto, 6 padrões de fluxo de trabalho, 52+ perfis de agentes reutilizáveis e roda inteiramente localmente com SQLite.

OpenClawRadar
lazyclaude: Uma Interface de Usuário em Terminal para Gerenciar Configurações de Código do Claude
Tools

lazyclaude: Uma Interface de Usuário em Terminal para Gerenciar Configurações de Código do Claude

lazyclaude é uma ferramenta de interface de usuário de terminal inspirada no lazygit que fornece uma única visualização para gerenciar toda a configuração do Claude Code armazenada em disco, incluindo arquivos de memória, habilidades, agentes, servidores MCP, configurações, permissões, hooks, atalhos de teclado, sessões, estatísticas, plugins e tarefas.

OpenClawRadar
Auto Router vs Sonnet: Economia de Custos vs Qualidade da Resposta
Tools

Auto Router vs Sonnet: Economia de Custos vs Qualidade da Resposta

O recurso Auto Router do Open Router seleciona dinamicamente LLMs com base na complexidade do contexto, oferecendo economias significativas de custo (0,8 centavos vs 0,00071 centavos por solicitação), mas os usuários relatam qualidade de resposta degradada em comparação com o Sonnet 4.6.

OpenClawRadar
Agentes Alternativos de IA para Codificação Após a Remoção do Plano do Claude
Tools

Agentes Alternativos de IA para Codificação Após a Remoção do Plano do Claude

Um usuário do Reddit testou várias alternativas de agentes de IA para programação após a descontinuação do plano de programação do Claude, incluindo Kimi (US$ 20/mês), Minimax (US$ 10/mês), Z.AI GLM (US$ 10/mês), Stepfun (US$ 6-10/mês), Mistral (US$ 15/mês) e Arcee Trinity (baseado em API).

OpenClawRadar