Codeset mejora los agentes de codificación con contexto específico del repositorio del historial de git.

✍️ OpenClawRadar📅 Publicado: 17 de abril de 2026🔗 Source

Qué hace Codeset

Codeset ejecuta un pipeline sobre tu historial de git y genera archivos que residen directamente en tu repositorio. Estos archivos incluyen: errores pasados por archivo con causas raíz, dificultades conocidas, relaciones de cambio conjunto y listas de verificación de pruebas. El agente de codificación lee estos archivos como parte de su ventana de contexto normal. Sin RAG, sin base de datos vectorial en tiempo de consulta, sin infraestructura en tiempo de ejecución requerida—solo archivos estáticos que tu agente recoge como cualquier otro archivo en el repositorio.

Resultados de evaluación comparativa

El equipo probó Codeset con dos puntos de referencia:

codeset-gym-python (150 tareas, mismo subconjunto que la evaluación de Claude): 60.7% → 66% (+5.3 puntos porcentuales)
SWE-Bench Pro (400 tareas muestreadas aleatoriamente): 56.5% → 58.5% (+2 puntos porcentuales)

Esto muestra una mejora consistente en ambos puntos de referencia, con ganancias menores en SWE-Bench Pro en comparación con codeset-gym. El punto de referencia codeset-gym es público con lista completa de tareas y verificadores disponibles para verificación de metodología.

Precios y disponibilidad

Codeset cuesta $5 por repositorio, pago único. Usa el código CODESETLAUNCH para una prueba gratuita. Los artefactos completos de evaluación están disponibles en https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

👀 Ver también

Herramientas

Claude Octopus v8.48: Complemento de Orquestación Multi-IA para Flujos de Trabajo de Desarrollo

Claude Octopus v8.48 es un complemento de código abierto que orquesta los modelos de IA Claude, Codex y Gemini en paralelo con roles distintos a lo largo de las fases de desarrollo. Incluye una puerta de consenso del 75% entre fases, ventanas de contexto nuevas para tareas complejas y comandos específicos como /octo:embrace para el desarrollo de ciclo de vida completo.

11 mar 2026, 03:45 UTC

OpenClawRadar

Herramientas

Merlin: Deduplicación de contexto LLM local-primero – mide hasta un 71% de superposición de fragmentos, gratuito y de núcleo abierto

Merlin es una herramienta de deduplicación de contexto local que midió un 22-71% de superposición de chunks en 22 millones de pasajes de sesiones reales de agentes/RAG. Se distribuye como proxy HTTP (Ollama/vLLM/SGLang/llama.cpp), servidor MCP (Claude/Cursor/OpenClaw) o CLI independiente. Código abierto MIT con límites de uso diario.

13 may 2026, 22:16 UTC

OpenClawRadar

Herramientas

Claude-voice: TTS local con resaltado de palabras para Claude Code

Claude-voice es una herramienta de Python que agrega síntesis de voz local con resaltado de palabras en tiempo real al modo de voz de Claude Code. Utiliza Kokoro TTS (82 millones de parámetros) ejecutándose completamente de forma local sin claves API.

15 mar 2026, 15:45 UTC

OpenClawRadar

Herramientas

Sistema de Memoria Automática de Código Abierto para Agentes LLM Logra un 94% de Precisión en Recuperación

Un desarrollador creó un complemento de memoria para agentes basados en LLM que extrae, clasifica y persiste automáticamente hechos entre sesiones sin comandos explícitos del usuario. El sistema logró un 94.2% de precisión en una prueba de memoria de 52 puntos de control utilizando archivos markdown estructurados en lugar de bases de datos vectoriales.

21 mar 2026, 09:45 UTC

OpenClawRadar