Klaw.sh: Оркестрация в стиле Kubernetes для ИИ-агентов

Klaw.sh — это платформа с открытым исходным кодом, предназначенная для управления ИИ-агентами в большом масштабе, использующая принципы, схожие с Kubernetes. Она облегчает развертывание и оркестрацию агентов через изолированные окружения с помощью кластеров и пространств имен, которые помогают управлять операциями на уровне команды, такими как маркетинг, продажи и поддержка. Ключевые функции включают бесперебойную интеграцию с коммуникационными платформами, такими как Slack, X и Discord.
Klaw.sh предлагает инструмент командной строки, похожий на kubectl, для управления агентами. Примеры команд включают:
klaw create cluster mycompanyklaw create namespace marketingklaw deploy agent.yaml
Разработчики переписали платформу с Node.js на Go, что позволило сократить использование памяти на одного агента с более чем 800 МБ до менее 10 МБ.
Примеры использования включают развертывание нескольких агентов на нескольких аккаунтах, обеспечивая, что один неправильно работающий агент не сможет повлиять на других благодаря изоляции пространств имен. Добавление нового аккаунта просто, требует всего лишь создания нового пространства имен и развертывания существующей конфигурации.
Klaw.sh функционирует на более высоком операционном уровне по сравнению с такими фреймворками, как CrewAI или LangGraph, которые сосредотачиваются на сотрудничестве агентов для выполнения задач. Он служит управленческим слоем, способным интегрировать такие фреймворки в свои пространства имен.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Плагин Keyoku заменяет статический пульс OpenClaw на автономность, управляемую памятью.
Keyoku — это бесплатный плагин для OpenClaw, который меняет механизм «сердцебиения» агента: вместо чтения статического файла HEARTBEAT.md он сканирует фактическое хранилище памяти агента на предмет зависшей работы, невыполненных обязательств, противоречивой информации и неактивных связей. Использует локальный движок на Go с SQLite + HNSW и предлагает три уровня автономии: наблюдение, предложение и действие.

Обход изоляции песочницы NemoClaw для локального агента Nemotron 9B
Разработчик обошёл изоляцию песочницы NemoClaw, чтобы запустить полностью локального агента с использованием Nemotron 9B и вызовом инструментов на одной видеокарте RTX 5090. Подход включал настройку iptables, пользовательский TCP-ретранслятор и перевод вызовов инструментов в реальном времени.

Бенчмаркинг Nemotron 3 Super 120B с контекстом в 1 миллион токенов на M1 Ultra.
Пользователь протестировал Nemotron 3 Super 120B с квантованной моделью Q4_K_M, используя llama.cpp на M1 Ultra, достигнув контекстного окна в 1 миллион токенов, которое потребовало примерно 90 ГБ видеопамяти. Бенчмарки производительности показывают скорость генерации токенов от 255 т/с при обработке промпта в 512 токенов до 22,37 т/с при контексте в 100 000 токенов.

Покемон Шоудаун ИИ-агенты, созданные с использованием бесплатных LLM API и вызова инструментов
Система, использующая Llama 3, Qwen, Gemma через бесплатные API-уровни для автономного ведения боев в Pokémon Showdown с помощью структурированных вызовов инструментов, поддерживает режимы «человек против ИИ» и «ИИ против ИИ».