Три репозитория для разработки RAG и AI-агентов

Три репозитория для разработки RAG и AI-агентов
Пользователь Reddit на r/LocalLLaMA поделился выводами из экспериментов с обработкой контекста в LLM-приложениях, отметив, что использование Retrieval-Augmented Generation (RAG) для всего не всегда оптимально. Они выделили три репозитория, которые стоит изучить разработчикам, работающим в этой области.
Ключевые детали из источника
- memvid: Выступает в качестве слоя памяти для AI-систем. Вместо того чтобы полагаться исключительно на эмбеддинги и векторные базы данных, он сохраняет записи памяти и извлекает контекст больше как состояние агента. Автор считает его более естественным для агентов, длинных диалогов, многошаговых рабочих процессов и истории использования инструментов.
- llama_index: Описывается как, вероятно, самый простой способ создания RAG-пайплайнов на данный момент. Он хорошо подходит для чата с документами, поиска по репозиториям, базам знаний и индексации файлов. Автор отмечает, что большинство RAG-проектов, которые он видит, используют его.
- Continue: Опенсорсный ассистент программирования, похожий на Cursor или Copilot. Интересен тем, как он сочетает поиск, индексацию, выбор контекста и память. Автор отмечает, что это показывает, что современные инструменты не используют чистый RAG, а скорее смесь индексации, извлечения и состояния.
Вывод автора: RAG отлично подходит для извлечения знаний, системы памяти лучше для агентов, а гибридные подходы — это то, что используют большинство реальных инструментов. В заключение он выражает любопытство по поводу того, что другие используют для памяти агентов.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

A2P: MCP-сервер, обеспечивающий соблюдение инженерной дисциплины для AI-агентов программирования
A2P (Architect-to-Product) — это инженерная AI-платформа, упакованная как MCP-сервер, которая обеспечивает контролируемый рабочий процесс: Архитектура → План → Сборка → Аудит → Безопасность → Развертывание, где каждый функциональный срез требует прохождения этапов RED → GREEN → REFACTOR → SAST → DONE.

Использование pre-commit для повышения качества и безопасности кода, созданного с помощью ИИ.
Разработчик делится своей конфигурацией pre-commit для проектов на Go и Java, используя инструменты вроде golangci-lint, govulncheck и checkov для выявления уязвимостей и проблем с качеством в коде, сгенерированном ИИ, перед коммитом.

Сервер базы знаний с открытым исходным кодом и координатор мультиагентных систем для постоянной памяти искусственного интеллекта
Разработчик создал пользовательский MCP-сервер на частном VPS, чтобы обеспечить Claude, Codex и Gemini постоянной памятью между сессиями, с сервером базы знаний, который загружает хранилища Obsidian, и мультиагентным оркестратором Daniel для отказоустойчивости.

Mind Protocol: Открытая система обеспечивает Claude постоянную память и интеграцию биометрических данных в реальном времени.
Mind Protocol — это система с открытым исходным кодом, в которой Claude работает непрерывно в качестве автономного компаньона с постоянной памятью во всех сессиях и данными с часов Garmin в реальном времени, поступающими в каждый диалог. Архитектура использует Claude Code в качестве основного движка с оркестратором, который запускает параллельные сессии и управляет их жизненным циклом.