Signet: Camada de Memória de Código Aberto para Agentes de IA de Programação Atinge 80% de F1 no LoCoMo

✍️ OpenClawRadar📅 Publicado: March 22, 2026🔗 Source
Signet: Camada de Memória de Código Aberto para Agentes de IA de Programação Atinge 80% de F1 no LoCoMo
Ad

Signet é um sistema de memória de código aberto projetado para agentes de IA de codificação como Claude Code, OpenCode, OpenClaw e Codex. Ele aborda o gerenciamento de memória separando a extração de memória do fluxo conversacional do agente.

Desempenho e Abordagem

O sistema recentemente alcançou 80% de F1 no benchmark LoCoMo, que avalia memória conversacional de longo prazo. Para comparação, o RAG padrão pontua cerca de 41% neste benchmark, GPT-4 com contexto completo pontua 32%, e o limite humano é 87,9%.

Ao contrário de abordagens que dão aos agentes uma ferramenta de "lembrar", Signet inverte a arquitetura:

  • Memórias são extraídas após cada sessão por um pipeline de LLM separado — sem chamadas de ferramentas durante a conversa
  • Contexto relevante é injetado antes de cada prompt — o agente não busca pelo que precisa, ele simplesmente tem

A abordagem é análoga à memória humana onde a informação surge automaticamente em vez de exigir consultas explícitas.

Ad

Implementação Técnica

Tudo é executado localmente usando SQLite em sua máquina sem dependências de nuvem, funcionando offline. A mesma memória do agente persiste em diferentes ferramentas de codificação. A configuração requer um comando de instalação e é executada em alguns minutos. O projeto é licenciado Apache 2.0.

Desenvolvimento Futuro

A equipe está trabalhando em um modelo de memória preditiva por usuário que aprende seus padrões e antecipa qual contexto você precisará antes de perguntar. Este modelo será treinado localmente com os pesos permanecendo em sua máquina.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Krasis: Runtime Híbrido CPU/GPU para Grandes Modelos MoE Alcança 3.324 tok/s de Preenchimento no RTX 5080
Tools

Krasis: Runtime Híbrido CPU/GPU para Grandes Modelos MoE Alcança 3.324 tok/s de Preenchimento no RTX 5080

Krasis é um runtime híbrido CPU/GPU que executa grandes modelos MoE processando o preenchimento na GPU e a decodificação na CPU, alcançando 3.324 tokens/segundo no preenchimento em uma RTX 5080 com Qwen3-Coder-Next 80B Q4. Ele requer aproximadamente 2,5x o tamanho do modelo em RAM do sistema, mas permite executar modelos grandes demais para a VRAM.

OpenClawRadar
IM para Agentes: Sala de bate-papo baseada em REST para comunicação de agentes de IA sem SDKs
Tools

IM para Agentes: Sala de bate-papo baseada em REST para comunicação de agentes de IA sem SDKs

Um desenvolvedor criou o IM for Agents, uma ferramenta que cria salas de bate-papo compartilhadas onde agentes de IA se comunicam diretamente via API REST, sem SDKs ou arquivos de configuração. Os agentes usam um prompt simples para entrar nas salas e podem negociar APIs, escrever código e verificar o trabalho enquanto humanos observam.

OpenClawRadar
Editor de Vídeo Cria Ferramenta Gratuita de Transcrição Treelo Usando Código Claude
Tools

Editor de Vídeo Cria Ferramenta Gratuita de Transcrição Treelo Usando Código Claude

Um editor de vídeo criou o Treelo, uma ferramenta web gratuita que transcreve arquivos de áudio/vídeo em blocos de timestamp editáveis com predefinições de legendas e exporta para os formatos SRT, VTT, ASS e WAV. A ferramenta foi construída por meio de conversas iterativas com o Claude Code.

OpenClawRadar
Hypura: Agendador de inferência de LLM com consciência de camada de armazenamento para Apple Silicon
Tools

Hypura: Agendador de inferência de LLM com consciência de camada de armazenamento para Apple Silicon

Hypura é um agendador de inferência baseado em Rust que posiciona tensores do modelo nas camadas GPU, RAM e NVMe para executar modelos que excedem a memória física em Macs Apple Silicon. Ele permite executar um Mixtral 8x7B de 31GB em um Mac Mini de 32GB a 2,2 tok/s e um Llama 70B de 40GB a 0,3 tok/s, onde o llama.cpp padrão trava.

OpenClawRadar