4-уровневая архитектура базы знаний для повышения точности ИИ-агентов

Разработчик на r/openclaw подробно описал архитектуру структурированной базы знаний, предназначенной для превращения универсальных LLM-агентов в экспертов в предметной области путем предоставления конкретного контекста об инструментах, рабочих процессах и политиках.
Проблема с распространенными подходами RAG
Источник указывает на несколько проблем типичных реализаций RAG: отсутствие классификации запросов (каждый вопрос проходит через один и тот же конвейер извлечения), отсутствие уровней (документы управления обрабатываются так же, как и посты в блоге), отсутствие бюджета (контекстное окно агента забито нерелевантными фрагментами) и отсутствие самовосстановления (устаревшие/сломанные документы остаются сломанными навсегда).
4-уровневый конвейер базы знаний
Система использует четыре различных уровня:
- Уровень управления — Всегда загружен. Содержит идентичность агента, политики и правила как не подлежащий обсуждению контекст.
- Уровень агента — Документация для каждого агента. Например, голосовой агент по имени Люси получает документацию по обработке звонков, а агент по имени Бинки (CRO) получает документацию по конверсиям.
- Релевантный уровень — Динамическое извлечение для каждого запроса с сопоставлением заголовка/содержимого, ограниченное максимум 5 документами и бюджетом в 12K символов на документ.
- Уровень вики — 200+ справочных статей, доступных для поиска через файловый мост, охватывающих историю ИИ, определения инструментов, шаблоны рабочих процессов и сравнения платформ.
Классификация запросов как секретное оружие
Перед любым извлечением классификатор на основе регулярных выражений определяет, сколько контекста требуется вопросу:
- ПРЯМОЙ — Для задач вроде «Обобщи этот текст», где база знаний не нужна.
- ТОЛЬКО_НАВЫК — Для задач вроде «Напиши мне твит», где достаточно документации по навыкам агента.
- ГОРЯЧИЙ_КЭШ — Для вопросов вроде «Кто занимается выставлением счетов?», на которые можно ответить из документов управления и агента в кэше памяти.
- ПОЛНЫЙ_RAG — Для сложных запросов вроде «Сравни цены n8n и Zapier», требующих полного векторного поиска и файлового моста.
Сообщается, что только эта классификация сократила расход токенов примерно на 40%, потому что большинству вопросов не нужен полный RAG.
Структура и организация базы знаний
Каждая из 200+ статей следует единому формату: четкий заголовок с областью охвата, практическое содержание (таблицы, примеры кода, схемы принятия решений), 2+ цитируемых источника с реальными URL, 5 описаний ссылок на изображения и 2 ссылки на видео.
Содержание организовано по конкретным областям:
- Основы ИИ/МО (18 статей) — история, трансформеры, эмбеддинги, агенты
- Инструменты (16 статей) — определения, безопасность, таксономия, обработка ошибок, аудит
- Рабочие процессы (18 статей) — типы, платформы, анализ стоимости, шаблоны HIL
- Генерация изображений (115 файлов) — 16 провайдеров, сравнения, фреймворки промптов
- Генерация видео (109 файлов) — обработки, конвейеры, руководства по платформам
- Поддержка (60 статей) — контент центра помощи клиентам
Система самовосстановления
Архитектура включает систему оценки, которая оценивает состояние базы знаний по шкале от 0 до 100 и автоматически решает проблемы: отсутствующие эмбеддинги запускают повторное встраивание, устаревший контент помечается для обновления, а сломанные ссылки исправляются или удаляются. Сообщается, что показатель состояния улучшился с 71 до 89 после первого прохода восстановления.
Результаты и ключевые выводы
До внедрения базы знаний агенты могли галлюцинировать определения инструментов, выдумывать цены и давать общие советы по рабочим процессам. После внедрения агенты цитируют конкретные документы, предоставляют точные сравнения платформ с реальными ценами и знают, когда сказать: «У меня нет актуальных данных по этому вопросу».
Ключевые выводы от реализации:
- Классифицируйте перед извлечением — не каждому вопросу нужен RAG.
- Бюджетируйте свое контекстное окно — 60K символов всего, с жестким лимитом на документ.
- Структура важнее объема — 200 хорошо организованных статей лучше, чем 10 000 случайных фрагментов.
- Самовосстановление не опционально — базы знаний деградируют, поэтому стройте мониторинг с первого дня.
- Пишите для агентов, а не для людей — отдавайте приоритет таблицам перед абзацами, схемам принятия решений перед прозой, и конкретным примерам перед абстрактными объяснениями.
📖 Read the full source: r/openclaw
👀 Смотрите также

Библиотека ведения журналов с открытым исходным кодом для соответствия Статье 12 Закона ЕС об искусственном интеллекте
Бесплатная библиотека с открытым исходным кодом на TypeScript для приложений Node.js, использующих Vercel AI SDK, которая реализует требования к ведению журналов по Статье 12 с помощью журналов только для добавления в формате JSONL, цепочки хешей SHA-256 для обнаружения несанкционированных изменений и принудительного хранения в течение 180 дней.

Извлечение компонентов OpenClaw: Опыт разработчика с очередью Lane и системой памяти
Разработчик попытался извлечь определённые компоненты из OpenClaw для использования в персональных AI-агентах, протестировав систему выполнения задач Lane Queue и изучив систему памяти memsearch. Lane Queue была успешно перереализована на Python с использованием документации, что выявило пробелы в ней и 13 проблем в реализации.

Исследование Clawe: Открытая система координации многопользовательских агентов
Clawe — это инструмент с открытым исходным кодом, который обеспечивает эффективную координацию многопользовательских агентов и предлагает такие функции, как планирование, управление задачами и уведомления в реальном времени.

Тестирование 88 малых моделей GGUF на Mac Mini M4 с 16 ГБ памяти.
Автоматизированный конвейер протестировал 88 моделей GGUF на Mac Mini M4 с 16 ГБ оперативной памяти, определив 9 непригодных к использованию и 4 модели LFM2-8B-A1B MoE на границе Парето по скорости и качеству.