Signet: Camada de Memória de Código Aberto para Agentes de IA de Programação Atinge 80% de F1 no LoCoMo

Signet é um sistema de memória de código aberto projetado para agentes de IA de codificação como Claude Code, OpenCode, OpenClaw e Codex. Ele aborda o gerenciamento de memória separando a extração de memória do fluxo conversacional do agente.
Desempenho e Abordagem
O sistema recentemente alcançou 80% de F1 no benchmark LoCoMo, que avalia memória conversacional de longo prazo. Para comparação, o RAG padrão pontua cerca de 41% neste benchmark, GPT-4 com contexto completo pontua 32%, e o limite humano é 87,9%.
Ao contrário de abordagens que dão aos agentes uma ferramenta de "lembrar", Signet inverte a arquitetura:
- Memórias são extraídas após cada sessão por um pipeline de LLM separado — sem chamadas de ferramentas durante a conversa
- Contexto relevante é injetado antes de cada prompt — o agente não busca pelo que precisa, ele simplesmente tem
A abordagem é análoga à memória humana onde a informação surge automaticamente em vez de exigir consultas explícitas.
Implementação Técnica
Tudo é executado localmente usando SQLite em sua máquina sem dependências de nuvem, funcionando offline. A mesma memória do agente persiste em diferentes ferramentas de codificação. A configuração requer um comando de instalação e é executada em alguns minutos. O projeto é licenciado Apache 2.0.
Desenvolvimento Futuro
A equipe está trabalhando em um modelo de memória preditiva por usuário que aprende seus padrões e antecipa qual contexto você precisará antes de perguntar. Este modelo será treinado localmente com os pesos permanecendo em sua máquina.
📖 Leia a fonte completa: r/openclaw
👀 See Also

Krasis: Runtime Híbrido CPU/GPU para Grandes Modelos MoE Alcança 3.324 tok/s de Preenchimento no RTX 5080
Krasis é um runtime híbrido CPU/GPU que executa grandes modelos MoE processando o preenchimento na GPU e a decodificação na CPU, alcançando 3.324 tokens/segundo no preenchimento em uma RTX 5080 com Qwen3-Coder-Next 80B Q4. Ele requer aproximadamente 2,5x o tamanho do modelo em RAM do sistema, mas permite executar modelos grandes demais para a VRAM.

IM para Agentes: Sala de bate-papo baseada em REST para comunicação de agentes de IA sem SDKs
Um desenvolvedor criou o IM for Agents, uma ferramenta que cria salas de bate-papo compartilhadas onde agentes de IA se comunicam diretamente via API REST, sem SDKs ou arquivos de configuração. Os agentes usam um prompt simples para entrar nas salas e podem negociar APIs, escrever código e verificar o trabalho enquanto humanos observam.

Editor de Vídeo Cria Ferramenta Gratuita de Transcrição Treelo Usando Código Claude
Um editor de vídeo criou o Treelo, uma ferramenta web gratuita que transcreve arquivos de áudio/vídeo em blocos de timestamp editáveis com predefinições de legendas e exporta para os formatos SRT, VTT, ASS e WAV. A ferramenta foi construída por meio de conversas iterativas com o Claude Code.

Hypura: Agendador de inferência de LLM com consciência de camada de armazenamento para Apple Silicon
Hypura é um agendador de inferência baseado em Rust que posiciona tensores do modelo nas camadas GPU, RAM e NVMe para executar modelos que excedem a memória física em Macs Apple Silicon. Ele permite executar um Mixtral 8x7B de 31GB em um Mac Mini de 32GB a 2,2 tok/s e um Llama 70B de 40GB a 0,3 tok/s, onde o llama.cpp padrão trava.