4-уровневая архитектура базы знаний для повышения точности ИИ-агентов

✍️ OpenClawRadar📅 Опубликовано: 20 марта 2026 г.🔗 Source
4-уровневая архитектура базы знаний для повышения точности ИИ-агентов
Ad

Разработчик на r/openclaw подробно описал архитектуру структурированной базы знаний, предназначенной для превращения универсальных LLM-агентов в экспертов в предметной области путем предоставления конкретного контекста об инструментах, рабочих процессах и политиках.

Проблема с распространенными подходами RAG

Источник указывает на несколько проблем типичных реализаций RAG: отсутствие классификации запросов (каждый вопрос проходит через один и тот же конвейер извлечения), отсутствие уровней (документы управления обрабатываются так же, как и посты в блоге), отсутствие бюджета (контекстное окно агента забито нерелевантными фрагментами) и отсутствие самовосстановления (устаревшие/сломанные документы остаются сломанными навсегда).

4-уровневый конвейер базы знаний

Система использует четыре различных уровня:

  • Уровень управления — Всегда загружен. Содержит идентичность агента, политики и правила как не подлежащий обсуждению контекст.
  • Уровень агента — Документация для каждого агента. Например, голосовой агент по имени Люси получает документацию по обработке звонков, а агент по имени Бинки (CRO) получает документацию по конверсиям.
  • Релевантный уровень — Динамическое извлечение для каждого запроса с сопоставлением заголовка/содержимого, ограниченное максимум 5 документами и бюджетом в 12K символов на документ.
  • Уровень вики — 200+ справочных статей, доступных для поиска через файловый мост, охватывающих историю ИИ, определения инструментов, шаблоны рабочих процессов и сравнения платформ.

Классификация запросов как секретное оружие

Перед любым извлечением классификатор на основе регулярных выражений определяет, сколько контекста требуется вопросу:

  • ПРЯМОЙ — Для задач вроде «Обобщи этот текст», где база знаний не нужна.
  • ТОЛЬКО_НАВЫК — Для задач вроде «Напиши мне твит», где достаточно документации по навыкам агента.
  • ГОРЯЧИЙ_КЭШ — Для вопросов вроде «Кто занимается выставлением счетов?», на которые можно ответить из документов управления и агента в кэше памяти.
  • ПОЛНЫЙ_RAG — Для сложных запросов вроде «Сравни цены n8n и Zapier», требующих полного векторного поиска и файлового моста.

Сообщается, что только эта классификация сократила расход токенов примерно на 40%, потому что большинству вопросов не нужен полный RAG.

Ad

Структура и организация базы знаний

Каждая из 200+ статей следует единому формату: четкий заголовок с областью охвата, практическое содержание (таблицы, примеры кода, схемы принятия решений), 2+ цитируемых источника с реальными URL, 5 описаний ссылок на изображения и 2 ссылки на видео.

Содержание организовано по конкретным областям:

  • Основы ИИ/МО (18 статей) — история, трансформеры, эмбеддинги, агенты
  • Инструменты (16 статей) — определения, безопасность, таксономия, обработка ошибок, аудит
  • Рабочие процессы (18 статей) — типы, платформы, анализ стоимости, шаблоны HIL
  • Генерация изображений (115 файлов) — 16 провайдеров, сравнения, фреймворки промптов
  • Генерация видео (109 файлов) — обработки, конвейеры, руководства по платформам
  • Поддержка (60 статей) — контент центра помощи клиентам

Система самовосстановления

Архитектура включает систему оценки, которая оценивает состояние базы знаний по шкале от 0 до 100 и автоматически решает проблемы: отсутствующие эмбеддинги запускают повторное встраивание, устаревший контент помечается для обновления, а сломанные ссылки исправляются или удаляются. Сообщается, что показатель состояния улучшился с 71 до 89 после первого прохода восстановления.

Результаты и ключевые выводы

До внедрения базы знаний агенты могли галлюцинировать определения инструментов, выдумывать цены и давать общие советы по рабочим процессам. После внедрения агенты цитируют конкретные документы, предоставляют точные сравнения платформ с реальными ценами и знают, когда сказать: «У меня нет актуальных данных по этому вопросу».

Ключевые выводы от реализации:

  • Классифицируйте перед извлечением — не каждому вопросу нужен RAG.
  • Бюджетируйте свое контекстное окно — 60K символов всего, с жестким лимитом на документ.
  • Структура важнее объема — 200 хорошо организованных статей лучше, чем 10 000 случайных фрагментов.
  • Самовосстановление не опционально — базы знаний деградируют, поэтому стройте мониторинг с первого дня.
  • Пишите для агентов, а не для людей — отдавайте приоритет таблицам перед абзацами, схемам принятия решений перед прозой, и конкретным примерам перед абстрактными объяснениями.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Библиотека ведения журналов с открытым исходным кодом для соответствия Статье 12 Закона ЕС об искусственном интеллекте
Инструменты

Библиотека ведения журналов с открытым исходным кодом для соответствия Статье 12 Закона ЕС об искусственном интеллекте

Бесплатная библиотека с открытым исходным кодом на TypeScript для приложений Node.js, использующих Vercel AI SDK, которая реализует требования к ведению журналов по Статье 12 с помощью журналов только для добавления в формате JSONL, цепочки хешей SHA-256 для обнаружения несанкционированных изменений и принудительного хранения в течение 180 дней.

OpenClawRadar
Извлечение компонентов OpenClaw: Опыт разработчика с очередью Lane и системой памяти
Инструменты

Извлечение компонентов OpenClaw: Опыт разработчика с очередью Lane и системой памяти

Разработчик попытался извлечь определённые компоненты из OpenClaw для использования в персональных AI-агентах, протестировав систему выполнения задач Lane Queue и изучив систему памяти memsearch. Lane Queue была успешно перереализована на Python с использованием документации, что выявило пробелы в ней и 13 проблем в реализации.

OpenClawRadar
Исследование Clawe: Открытая система координации многопользовательских агентов
Инструменты

Исследование Clawe: Открытая система координации многопользовательских агентов

Clawe — это инструмент с открытым исходным кодом, который обеспечивает эффективную координацию многопользовательских агентов и предлагает такие функции, как планирование, управление задачами и уведомления в реальном времени.

OpenClawRadar
Тестирование 88 малых моделей GGUF на Mac Mini M4 с 16 ГБ памяти.
Инструменты

Тестирование 88 малых моделей GGUF на Mac Mini M4 с 16 ГБ памяти.

Автоматизированный конвейер протестировал 88 моделей GGUF на Mac Mini M4 с 16 ГБ оперативной памяти, определив 9 непригодных к использованию и 4 модели LFM2-8B-A1B MoE на границе Парето по скорости и качеству.

OpenClawRadar