Codeset mejora los agentes de codificación con contexto específico del repositorio del historial de git.

✍️ OpenClawRadar📅 Publicado: 17 de abril de 2026🔗 Source
Codeset mejora los agentes de codificación con contexto específico del repositorio del historial de git.
Ad

Qué hace Codeset

Codeset ejecuta un pipeline sobre tu historial de git y genera archivos que residen directamente en tu repositorio. Estos archivos incluyen: errores pasados por archivo con causas raíz, dificultades conocidas, relaciones de cambio conjunto y listas de verificación de pruebas. El agente de codificación lee estos archivos como parte de su ventana de contexto normal. Sin RAG, sin base de datos vectorial en tiempo de consulta, sin infraestructura en tiempo de ejecución requerida—solo archivos estáticos que tu agente recoge como cualquier otro archivo en el repositorio.

Ad

Resultados de evaluación comparativa

El equipo probó Codeset con dos puntos de referencia:

  • codeset-gym-python (150 tareas, mismo subconjunto que la evaluación de Claude): 60.7% → 66% (+5.3 puntos porcentuales)
  • SWE-Bench Pro (400 tareas muestreadas aleatoriamente): 56.5% → 58.5% (+2 puntos porcentuales)

Esto muestra una mejora consistente en ambos puntos de referencia, con ganancias menores en SWE-Bench Pro en comparación con codeset-gym. El punto de referencia codeset-gym es público con lista completa de tareas y verificadores disponibles para verificación de metodología.

Precios y disponibilidad

Codeset cuesta $5 por repositorio, pago único. Usa el código CODESETLAUNCH para una prueba gratuita. Los artefactos completos de evaluación están disponibles en https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

El Servidor MCP de Lanzamiento de Motor Proporciona una Tubería de 39 Herramientas para Validación Empresarial
Herramientas

El Servidor MCP de Lanzamiento de Motor Proporciona una Tubería de 39 Herramientas para Validación Empresarial

Launch Engine es un servidor MCP que le proporciona a Claude una canalización estructurada con 39 herramientas de Procedimientos Operativos Estándar interconectadas, organizadas en 5 capas, para llevar ideas de negocio desde el concepto hasta los ingresos validados. El sistema incluye subagentes especializados, aplicación de prerrequisitos y herramientas para evaluación por lotes y pruebas rápidas.

OpenClawRadar
OpenRoom: Una Interfaz Gráfica de Escritorio Basada en Web para Visualizar las Habilidades de los Agentes de IA
Herramientas

OpenRoom: Una Interfaz Gráfica de Escritorio Basada en Web para Visualizar las Habilidades de los Agentes de IA

OpenRoom es un entorno de escritorio basado en web donde operan agentes de IA, con actualizaciones en tiempo real del estado del sistema como diarios y archivos durante las interacciones de chat, además de un modo de transmisión en vivo para la interacción de múltiples bots.

OpenClawRadar
Loom: Un Arnés de Ejecución Local para Tareas Complejas de IA
Herramientas

Loom: Un Arnés de Ejecución Local para Tareas Complejas de IA

Loom es un arnés de ejecución local de código abierto diseñado para gestionar tareas complejas proporcionando un proceso estructurado con alrededor de 50 herramientas, un sistema de complementos de paquetes personalizados para flujos de trabajo repetibles, e interfaces tanto de CLI como de servidor MCP.

OpenClawRadar
agent-recall: MCP local de SQLite para memoria de código persistente de Claude
Herramientas

agent-recall: MCP local de SQLite para memoria de código persistente de Claude

agent-recall es un servidor MCP que proporciona a Claude Code memoria persistente entre sesiones utilizando un archivo SQLite local. Ofrece 9 herramientas MCP para guardar entidades, relaciones y observaciones, con resúmenes generados por LLM al inicio de cada sesión en lugar de volcados de datos crudos.

OpenClawRadar