Codeset melhora os agentes de codificação com contexto específico do repositório a partir do histórico do git.

✍️ OpenClawRadar📅 Publicado: April 17, 2026🔗 Source
Codeset melhora os agentes de codificação com contexto específico do repositório a partir do histórico do git.
Ad

O que o Codeset faz

O Codeset executa um pipeline sobre o seu histórico do git e gera arquivos que ficam diretamente no seu repositório. Esses arquivos incluem: bugs anteriores por arquivo com causas raiz, armadilhas conhecidas, relações de co-mudança e listas de verificação de testes. O agente de programação lê esses arquivos como parte de sua janela de contexto normal. Sem RAG, sem banco de dados vetorial no momento da consulta, sem infraestrutura de tempo de execução necessária—apenas arquivos estáticos que seu agente pega como qualquer outro arquivo no repositório.

Resultados de benchmark

A equipe testou o Codeset com dois benchmarks:

  • codeset-gym-python (150 tarefas, mesmo subconjunto da avaliação do Claude): 60,7% → 66% (+5,3 pontos percentuais)
  • SWE-Bench Pro (400 tarefas amostradas aleatoriamente): 56,5% → 58,5% (+2 pontos percentuais)

Isso mostra uma melhoria consistente em ambos os benchmarks, com ganhos menores no SWE-Bench Pro em comparação com o codeset-gym. O benchmark codeset-gym é público com lista completa de tarefas e verificadores disponíveis para verificação da metodologia.

Ad

Preços e disponibilidade

O Codeset custa US$ 5 por repositório, pagamento único. Use o código CODESETLAUNCH para um teste gratuito. Os artefatos completos de avaliação estão disponíveis em https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Automatizando Notas de Lançamento do Claude Desktop a partir de Apps Electron Minificados
Tools

Automatizando Notas de Lançamento do Claude Desktop a partir de Apps Electron Minificados

Um desenvolvedor criou um pipeline automatizado usando Claude Sonnet e Opus 4.6 para gerar notas de lançamento para o Claude Desktop no Linux, abordando a falta de notas de lançamento oficiais da Anthropic. O sistema extrai, normaliza e analisa o código minificado do aplicativo Electron como parte de um fluxo de trabalho de CI/CD.

OpenClawRadar
OpenObscure: Firewall de Privacidade de Código Aberto para Agentes de IA em Dispositivos
Tools

OpenObscure: Firewall de Privacidade de Código Aberto para Agentes de IA em Dispositivos

OpenObscure é um firewall de privacidade de código aberto e no dispositivo que fica entre agentes de IA e provedores de LLM, usando Criptografia de Preservação de Formato FF1 para criptografar valores de PII antes que as solicitações saiam do seu dispositivo. Inclui detecção de PII com 99,7% de recall, varredura de firewall cognitivo e executa em macOS/Linux/Windows com bindings para iOS/Android.

OpenClawRadar
Desenvolvedor solo constrói agente de IA multiplataforma para desktop com controle remoto móvel em 3 semanas e envia para mais de 40 países
Tools

Desenvolvedor solo constrói agente de IA multiplataforma para desktop com controle remoto móvel em 3 semanas e envia para mais de 40 países

Um desenvolvedor solo construiu o Skales, um agente de IA nativo para desktop com mais de 139 ferramentas e um aplicativo complementar para controle remoto — tudo em 3 semanas usando Claude. O app roda em macOS, Windows e Linux, é local-first e gratuito, e já tem usuários ativos em mais de 40 países.

OpenClawRadar
Plugin GTM de Código Aberto para Claude Code com 166 Habilidades de Marketing e Comando Bootstrap
Tools

Plugin GTM de Código Aberto para Claude Code com 166 Habilidades de Marketing e Comando Bootstrap

Um desenvolvedor lançou um plugin de código aberto Go-To-Market para o Claude Code que oferece 166 habilidades especializadas de marketing em SEO, conteúdo, outbound, vendas, crescimento, análise, estratégia, anúncios, social, CRM e busca por IA. O plugin inclui um comando /bootstrap que entrevista os usuários sobre sua marca para gerar arquivos de contexto personalizados.

OpenClawRadar