SourceBridge: Инструмент с открытым исходным кодом для анализа кодовой базы с использованием локальных LLM

SourceBridge — это проект с открытым исходным кодом, который использует локальные LLM для построения структурированного понимания кодовых баз. Вы указываете ему на Git-репозиторий, и он индексирует кодовую базу в граф символов, содержащий файлы, функции, классы и зависимости. Затем инструмент использует вашу LLM для построения иерархического дерева понимания, начиная с отдельных сегментов кода и поднимаясь через файлы, пакеты и весь репозиторий.
Что он генерирует
- Краткие сводки: многоуровневые резюме, основанные на реальном коде
- Экскурсии по коду: архитектурно упорядоченные обзоры с конкретными ссылками на файлы/функции
- Обучающие пути: педагогически структурированные материалы для введения в проект
- Истории рабочих процессов: трассировка потоков данных через систему
- Семантический поиск по графу репозитория
Поддержка локальных моделей
Поддержка локальных моделей была приоритетом с первого дня. В настоящее время поддерживаемые бэкенды включают:
- Ollama — основной локальный бэкенд, на котором разработчик тестирует ежедневно
- llama.cpp — прямая поддержка llama-server, немного быстрее, чем Ollama, в тестах
- vLLM — для GPU-серверов
- LM Studio — включая спекулятивное декодирование
- SGLang — для многопроцессорных GPU-конфигураций
Все бэкенды работают через API, совместимое с OpenAI, поэтому работает всё, что использует этот протокол. Облачные провайдеры (Anthropic, OpenAI, Gemini, OpenRouter) также поддерживаются для случаев, когда требуется более высокое качество для конкретных задач.
Производительность моделей
Разработчик в основном запускает его на Qwen 3.5 35B-A3B (MoE, только 3B активных параметров) через llama.cpp на Mac Studio. При квантовании Q4_K_XL он работает со скоростью примерно 50 токенов в секунду и создаёт качественные краткие сводки и экскурсии по коду. Для больших репозиториев тестировалась Qwen 3.5 122B-A10B через Ollama — она показывает лучшее следование инструкциям, но требует около 76 ГБ ОЗУ.
Для задач понимания (резюмирование кода, построение дерева понимания) модели класса 32B справляются достаточно хорошо. Разрыв в качестве между локальными и облачными моделями заметен, но не является критичным для большинства случаев использования. Облачные модели всё ещё явно выигрывают в генерации отчётов, где требуется, чтобы LLM следовала сложным инструкциям форматирования без зацикливания.
Режим мышления в моделях Qwen 3.5 по умолчанию отключён — он тратит токены на цепочки рассуждений, которые не улучшают вывод понимания. Это настраивается через переменную окружения, если вы хотите поэкспериментировать.
Архитектура
- API-сервер на Go (индексация, аутентификация, очередь заданий, хранилище графов)
- Рабочий процесс на Python gRPC (вызовы LLM, конвейер понимания, генерация артефактов)
- Веб-интерфейс Next.js (отображение прогресса в реальном времени, просмотр Markdown)
- SurrealDB (графовые данные, артефакты знаний, состояние заданий)
- Все три компонента докеризированы, запускаются командой
docker compose up
Рабочий процесс обрабатывает очереди, повторные попытки, откаты и отмену — поэтому, если ваша локальная модель работает медленно или падает в процессе генерации, система восстанавливается корректно, а не теряет работу.
Начало работы
git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# Отредактируйте config.toml — укажите llm.provider на ваш экземпляр Ollama/llama.cpp
docker compose up
Ваш код никогда не покидает ваш компьютер. Вывод LLM остаётся локальным. Есть возможность отказаться от анонимной телеметрии (только подсчёт установок, отключите с помощью DO_NOT_TRACK=1).
Разработчик ищет отзывы от людей, запускающих локальные модели, о том, что работает, а что нет, особенно относительно того, какие модели дают лучший результат понимания, стоят ли модели MoE компромисса по ОЗУ по сравнению с плотными моделями, и о любых проблемах с конкретными бэкендами.
📖 Прочитать полный источник: r/LocalLLaMA
👀 Смотрите также

Термрендер: 6-кратно эффективная по токенам ASCII-визуализация интерфейса для Claude
Termrender — это инструмент с открытым исходным кодом на Python, который генерирует ASCII-визуализации интерфейсов с эффективностью использования токенов в 6 раз выше по сравнению с исходным выводом Claude. Он создаёт диаграммы и панели, используя минимальное количество токенов для более быстрой генерации и редактирования.

Портирование Autoresearch от Karpathy на Apple Neural Engine для повышения производительности на ватт
Прототип объединяет проект автоисследований Андрея Карпати с обратно спроектированной производительностью Apple Neural Engine, стремясь к лучшей пропускной способности на ватт по сравнению с официальными API. Проект построен на существующих репозиториях GitHub и признаёт вклад нескольких разработчиков.

Плагин HomeClaw соединяет Apple HomeKit с OpenClaw.
HomeClaw — это плагин OpenClaw, который подключает устройства Apple Home/HomeKit к OpenClaw. Для сборки и запуска требуется аккаунт разработчика Apple из-за ограничений Apple HomeKit для нотариально заверенных дистрибутивов.

Хеддл: Принудительное обеспечение доверия и ведение журнала аудита для подключений Claude Desktop MCP
Heddle — это инструмент с открытым исходным кодом, который добавляет уровни доверия, контроль доступа и журнал аудита к MCP-подключениям Claude Desktop, позволяя безопасно управлять несколькими сервисами через единый интерфейс с шестью стартовыми пакетами.