Qwen3.5 35B-A3B MoE выполняет 27-шаговый агентный рабочий процесс локально на оборудовании среднего класса.

Демонстрация локального агентного рабочего процесса
Разработчик на r/LocalLLaMA сообщил об успешном запуске сложного агентного рабочего процесса локально с использованием Qwen3.5 35B-A3B MoE. Модель автономно выполнила 27-шаговую цепочку обработки видео на оборудовании среднего уровня.
Детали рабочего процесса
Задача включала обработку видео по одному естественноязыковому запросу:
- Загрузить видео
- Транскрибировать с помощью Whisper
- Отредактировать субтитры
- Встроить субтитры обратно в видео с пользовательским стилем
Рабочий процесс состоял из 27 последовательных вызовов инструментов, включая: extract_audio, transcribe, read_file, edit_file, burn_subtitles, а также шаги проверки. Модель планировала, выполняла, проверяла каждый шаг и самостоятельно корректировала при необходимости.
Технические характеристики
Оборудование:
- Мобильная рабочая станция Lenovo ThinkPad P53
- Процессор Intel i7-9850H
- Quadro RTX 3000 (6 ГБ видеопамяти)
- 48 ГБ оперативной памяти DDR4 2666 МТ/с
Программный стек:
- Полная локальная реализация с llama.cpp + whisper.cpp
- Облачные API не использовались
Конфигурация модели:
- Qwen3.5 35B-A3B MoE с квантованием Q4_K_M
- Архитектура MoE с ~3 млрд активных параметров на токен
- Помещается и работает на 6 ГБ видеопамяти с выгрузкой слоёв
- Полная база знаний на 35 млрд параметров
Результаты производительности
Полный рабочий процесс занял примерно 10 минут, причём большая часть времени ушла на вывод. Разработчик отметил ноль ошибок и ноль вмешательства человека в течение 27-шаговой цепочки. Архитектура MoE сделала это возможным на оборудовании среднего уровня, сохраняя низкое количество активных параметров при сохранении полной возможности модели.
Это демонстрирует, что локальные агентные рабочие процессы становятся практичными на потребительском оборудовании, особенно с моделями MoE, которые балансируют количество активных параметров для скорости с полным количеством параметров для возможностей.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Непрограммист создает веб-приложение Sleep Sound Mixer с помощью Claude AI.
Пользователь без опыта программирования использовал Claude AI для создания полностью функционального веб-приложения «Микшер звуков для сна» за одну сессию. Приложение позволяет микшировать шесть фоновых звуков с индивидуальными регуляторами громкости через чистый минималистичный интерфейс в браузере.

Claude Opus 4.6 проводит обратную разработку системы аутентификации игры за 7 минут с использованием Ghidra MCP.
Разработчик использовал Claude Opus 4.6 с плагином MCP-сервера Ghidra для реверс-инжиниринга метода проверки аутентификации для Command & Conquer: Kane's Wrath. ИИ проанализировал чистый бинарный файл, определил функцию проверки, создал патч и переименовал все функции и структуры данных примерно за 7 минут.

Клод Опус 4.6 против Соннета 4.6 для философской аргументации: прямое сравнение пользователя
Подробное сравнение Claude Opus 4.6 и Sonnet 4.6 для философской и гуманитарной работы показывает, что Opus превосходит в аналитическом разложении, но упрощает подтекст, в то время как Sonnet лучше улавливает нюансы, но имеет более слабый стиль письма. Пользователь обнаружил, что Opus утомителен для мышления, насыщенного импликациями, и переключился на Sonnet.

Разработчик создает и выпускает мобильную игру, используя код Claude.
Разработчик использовал Claude Code для создания и выпуска полноценной мобильной игры под названием Blaster Balls — физической головоломки для Android. ИИ занимался основными игровыми системами, структурой проекта, интерфейсом и итерациями функций, в то время как разработчик сосредоточился на ощущениях от игры, механиках и монетизации.