Локальный Multi-Agent: vLLM, Claude Code, gpt-oss-120b на Linux

Разработчик поделился опытом создания полностью локальной параллельной мультиагентной системы для программирования на Linux после перехода с Windows. Конфигурация использует vLLM для параллельного вывода, Claude Code для оркестрации агентов и большую языковую модель для задач программирования.

Компоненты системы

Контейнер Docker с vLLM: Используется для простого развертывания и параллельного вывода
Claude Code: Управляет вибекодингом и оркестрацией команд агентов, настроен на указание локального эндпоинта vLLM вместо облачных провайдеров
gpt-oss:120b: Служит в качестве кодирующего агента
RTX Pro 6000 Blackwell MaxQ: Основной GPU для рабочих нагрузок
Двойная загрузка Ubuntu: Настройка операционной системы

Производительность и улучшения рабочего процесса

Ранее разработчик использовал Ollama и LM Studio, но обнаружил, что они обрабатывают запросы последовательно и испытывают замедления после нескольких поворотов сообщений и вызовов инструментов. С vLLM он достиг параллельной обработки, которая «ускорила» его опыт.

В тестировании система справилась с 4 агентами, работающими одновременно, как показано в видеодемонстрации, при этом GPU способен поддерживать 8 агентов параллельно непрерывно. Единственной отмеченной проблемой было снижение пропускной способности, которое варьируется в зависимости от агента.

Задачи масштаба команд агентов, которые ранее занимали часы для последовательного выполнения, теперь могут быть выполнены примерно за 30 минут, в зависимости от объема проекта. Разработчик оценивает, что добавление второго GPU MaxQ потенциально может масштабировать систему для обработки десятков агентов одновременно.

Этот параллельный подход позволяет выполнять вибекодинг нескольких проектов локально и одновременно, хотя в некоторых сценариях может возникать повышенная задержка. Разработчик считает этот компромисс предпочтительнее, чем завершение проектов по одному агенту за раз.

📖 Прочитать полный источник: r/LocalLLaMA

Локальная настройка Multi-Agent с использованием vLLM, Claude Code и gpt-oss-120b на Linux

Компоненты системы

Производительность и улучшения рабочего процесса

👀 Смотрите также

Пользователь OpenClaw сообщает об улучшении функциональности после подключения к документации через MCP.

Пользователь OpenClaw развивает навыки суммирования банковских выписок и отчетов по кредитным картам.

Автоисследование с Claude Code в рабочей кодовой базе: 60 экспериментов, 3 изменения сохранены

Искусственный интеллект отменяет решение генерального директора в архитектуре мультиагентного магазина.