Исследование Aura: Локальный инструмент компилирует документы в навигационную вики с постоянной памятью для ИИ

Aura Research — это инструмент с открытым исходным кодом, который компилирует исходные документы в вики, доступную для навигации с помощью ИИ, с постоянной памятью. Инструмент работает полностью локально, без передачи данных за пределы вашего компьютера.
Как это работает
Рабочий процесс состоит из четырёх основных команд:
pip install aura-research
research init my-project
# copy docs into raw/
research ingest raw/
research compile
research query "your question"Вы помещаете папку с исходными документами (PDF-файлы, статьи, заметки, код, поддерживается более 60 форматов), и большая языковая модель компилирует их в структурированную вики на языке markdown со связанными статьями, страницами понятий и главным указателем. Затем всё сжимается в архив .aura, оптимизированный для поиска с помощью RAG, который, по утверждению разработчика, примерно на 97% меньше исходных данных.
Ключевые проектные решения
- Нет эмбеддингов, нет векторных баз данных. Вместо этого используются SimHash + Bloom Filters с нулевым потреблением оперативной памяти
- Встроенная трёхуровневая операционная система памяти (факты / эпизодическая / черновик), чтобы большая языковая модель не забывала важный контекст между сессиями
- Вики состоит просто из файлов .md, которые можно просматривать в Obsidian, VS Code или любом редакторе markdown
- Работает с любым провайдером больших языковых моделей (OpenAI, Anthropic, Gemini) или как инструмент, встроенный в агента, внутри Claude Code/Gemini CLI, где не требуется API-ключ
- Всё работает локально, без передачи данных за пределы вашего компьютера
Подход «без эмбеддингов»
Разработчик сознательно избегал стандартного конвейера RAG (разделение → эмбеддинг → векторный поиск). Вместо этого большая языковая модель компилирует знания в хорошо структурированную вики с указателем. При запросе она читает указатель, находит 2–3 релевантные статьи и загружает только их. Этот подход предполагает, что если знания правильно организованы, большая языковая модель достаточно умна, чтобы ориентироваться в хорошей структуре файлов без необходимости в отдельной модели эмбеддинга.
Инструмент доступен на GitHub по адресу https://github.com/Rtalabs-ai/aura-research и может быть установлен через PyPI с помощью pip install aura-research.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Контекстиум: Открытый Фреймворк Постоянного Контекста для Claude Code
Contextium — это структурированный фреймворк для git-репозиториев, который обеспечивает постоянный контекст для сессий Claude Code, используя файл CLAUDE.md в качестве маршрутизатора контекста для ленивой загрузки соответствующих markdown-файлов. Открытая версия включает шаблон с 6 примерами приложений и 27 документациями по интеграциям.

MOOSE-Star: Модель на 7B параметров и набор данных из 108 000 статей для открытия научных гипотез – ICML 2026
MiroMind выпускает MOOSE-Star на Hugging Face: модель на 7B параметров (дообучение DeepSeek-R1-Distill-Qwen-7B) для открытия научных гипотез вместе с набором данных TOMATO-Star из 108 тыс. статей. Бенчмарк показывает, что MS-7B достигает 54,34% точности поиска вдохновляющих работ, превосходя GPT-5.4 и приближаясь к Gemini-3 Pro.

Предоставление Клоду локальной LLM в качестве ассистента через MCP на Mac
Разработчик подключает Claude к локальной Qwen 2.5 Coder 14B через Ollama и MCP, создавая бесплатного ассистента для делегирования задач, таких как обработка текста и работа с большими файлами.

Подсказка для ассистента немецкой бюрократии Клода: Структурированная юридическая переписка
Подробный системный промпт для Claude, превращающий ИИ в структурированного ассистента для немецкой бюрократии, контрактов, страховых споров и официальных писем, со строгой проверкой фактов и форматированием по стандарту DIN 5008.