Culpa: Открытый движок детерминированного воспроизведения для отладки ИИ-агентов

Culpa — это механизм детерминированного воспроизведения с открытым исходным кодом, специально разработанный для отладки сессий AI-агентов. Основная проблема, которую он решает, — недетерминированная природа LLM-агентов: когда они дают сбой, невозможно воспроизвести точный сбой, просто повторно запустив сессию.
Как это работает
Инструмент записывает каждый вызов LLM вместе с полным контекстом выполнения во время сессии агента. Когда вам нужно отладить сбой, он воспроизводит сессию, используя записанные ответы в качестве заглушек вместо выполнения новых вызовов к API. Это делает воспроизведение полностью детерминированным и бесплатным, поскольку не затрагивает реальные API.
Ключевые возможности
- Режим прокси: Работает с такими инструментами, как Claude Code и Cursor, без необходимости изменять код
- Python SDK: Доступен для разработчиков, создающих собственных агентов
- Поддержка API: Совместим с API Anthropic и OpenAI
- Возможность ветвления: Вы можете создать ветвление в любой записанной точке принятия решения, внедрить другой ответ и посмотреть, что бы произошло
Практические преимущества
Поскольку воспроизведение использует записанные ответы вместо реальных вызовов к API, сессии отладки не несут затрат на API. Детерминированная природа воспроизведения позволяет надёжно воспроизводить и анализировать сбои, которые иначе было бы невозможно воссоздать из-за присущей случайности в ответах LLM.
Проект активно собирает обратную связь, особенно от разработчиков, создающих рабочие процессы агентов. Создатель отмечает, что он первокурсник по компьютерным наукам и стремится улучшить инструмент.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

SkyClaw: Открытая среда выполнения агентов, написанная на Rust
SkyClaw — это среда выполнения агентов с открытым исходным кодом, написанная на Rust, с 34 новыми функциями, реализованными в 7 этапах разработки. Она включает контрольные точки задач, устойчивые очереди на базе SQLite, параллельное выполнение инструментов и поддержку мультитенантности.

Слепое пятно MCP: Внешний мозг для AI-агентов в программировании
Blindspot MCP — это инструмент, который индексирует полные кодовые базы с использованием tree-sitter и SQLite, чтобы помочь AI-агентам для программирования понимать символы, зависимости и связи между файлами, предотвращая изменения, которые могут нарушить код за пределами их непосредственного контекста.

OpenClaw Smart Router с открытым исходным кодом для автоматического выбора моделей
Разработчик опубликовал в открытом доступе Smart Router для OpenClaw, который автоматически классифицирует запросы по сложности и направляет их к оптимальным моделям, экономя 60-80% затрат на API по сравнению с постоянным использованием премиальных моделей, таких как Claude или GPT-4o.

Conduid.com индексирует более 23 000 MCP-серверов в поисковый каталог.
Conduid.com агрегирует MCP-серверы из 11 источников, удаляет дубликаты и предоставляет поиск, категории и оценки доверия на основе активности на GitHub, качества документации и признаков поддержки.