Сервер MCP: Сравнение локальных и облачных LLM с функцией дебатов

Сервер MCP разработан для упрощения сравнения локальных и облачных языковых моделей, позволяя одновременно делать запросы к нескольким поставщикам. Этот инструмент создан пользователем с ником nesquikm и поддерживает интеграцию с локальными моделями через Ollama, а также с облачными API, такими как OpenAI, Gemini, Groq и Together AI.
Ключевые детали
- Поддерживаемые поставщики: Можно настраивать для Ollama, LM Studio или любого другого совместимого с OpenAI конечного точки.
- Смешивайте и сопоставляйте модели: Комбинируйте локальные модели и различных облачных провайдеров в одном запросе.
- Функции сравнения: Ответы отображаются рядом, с возможностью для моделей голосовать за лучший подход или участвовать в структурированных дебатах, где третья модель оценивает ответы.
- Использование: Быстрый старт с командой
npx mcp-rubber-duck. Совместим с несколькими IDE и платформами, такими как Claude Desktop, Cursor, VS Code или любым клиентом MCP, а также может быть развернут через Docker. - Настройка: Репозиторий доступен на GitHub по адресу mcp-rubber-duck и написан на TypeScript под лицензией MIT. Учтите, что этот инструмент все еще на ранних стадиях разработки, и отзывы приветствуются, особенно от тех, кто использует локальные модели в качестве поставщиков.
Этот инструмент может быть особенно полезен для разработчиков, заинтересованных в том, чтобы понять, как различные модели подходят к определенным задачам, особенно когда возникают расхождения.
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Снижение задержки мультимодального агента за счет исключения истории скриншотов
Разработчик обнаружил, что исключение предыдущих скриншотов из запросов мультимодальных агентов и замена данных изображений в формате base64 на строки "[изображение опущено]" значительно снижает задержку при сохранении производительности. Эксперимент проводился с использованием Claude и задокументирован на GitHub.

Система самообновляемого перевода для OpenClaw автоматически поддерживает предметные глоссарии.
Скрипт на Python использует API Kimi2.5 для перевода файлов субтитров .srt с сохранением индексов блоков, временных меток и сегментации. Система использует профили проектов с файлами glossary.json, style.md и memory.jsonl, а также включает cron-задачу, которая сканирует официальные источники каждые 6 часов для обновления терминологии.

Мобильное приложение Off Grid добавило использование ИИ-инструментов на устройстве с трёхкратным увеличением скорости.
Мобильное приложение Off Grid теперь позволяет моделям ИИ использовать инструменты, такие как веб-поиск, калькулятор, дата/время и информацию об устройстве, полностью офлайн, с настраиваемыми параметрами кэша KV, обеспечивающими до 30 токенов в секунду на телефонах.

Подробности API инструментов Claude Code раскрыты
Пользователь Reddit извлек детали о Tool API Claude Code, включая операции с файловой системой, выполнение команд bash, веб-поиск и структуру вызовов инструментов с использованием XML-подобных блоков.