Улучшение кодирующих агентов на 5,3%: контекст из git от Codeset

Что делает Codeset

Codeset запускает конвейер обработки вашей истории git и генерирует файлы, которые размещаются непосредственно в вашем репозитории. Эти файлы включают: прошлые ошибки для каждого файла с корневыми причинами, известные подводные камни, взаимосвязи совместных изменений и контрольные списки тестов. Кодирующий агент читает эти файлы как часть своего обычного контекстного окна. Никакого RAG, никакой векторной базы данных во время запроса, никакой инфраструктуры времени выполнения не требуется — только статические файлы, которые ваш агент подхватывает, как и любые другие файлы в репозитории.

Результаты тестирования

Команда протестировала Codeset с двумя бенчмарками:

codeset-gym-python (150 задач, тот же поднабор, что и в оценке Claude): 60,7% → 66% (+5,3 процентных пункта)
SWE-Bench Pro (400 случайно выбранных задач): 56,5% → 58,5% (+2 процентных пункта)

Это показывает стабильное улучшение по обоим бенчмаркам, с меньшим приростом на SWE-Bench Pro по сравнению с codeset-gym. Бенчмарк codeset-gym является публичным, с полным списком задач и доступными верификаторами для проверки методологии.

Цены и доступность

Codeset стоит $5 за репозиторий, единовременный платеж. Используйте код CODESETLAUNCH для бесплатного пробного периода. Полные артефакты оценки доступны по адресу https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

Codeset улучшает работу кодирующих агентов, предоставляя контекст из истории git, специфичный для репозитория.

Что делает Codeset

Результаты тестирования

Цены и доступность

👀 Смотрите также

Когнитивная наука повышает креативность языковых моделей: команда /reframe для Claude Code

Плагин AxonFlow для OpenClaw: Предварительное утверждение инструментов и удаление личных данных

Гем Rails-AI-Context предоставляет коду Claude полную модель приложения Rails через MCP.

Сервер MCP для локальных файлов XMind Mind Map выпущен