Келет: Автоматизированный анализ первопричин для ИИ-агентов

Что делает Kelet
Kelet — это сервис, который непрерывно отслеживает AI-агентов и LLM-приложения в продакшене, чтобы автоматически определять причины их сбоев. Вместо того чтобы агенты падали с явными ошибками, они часто тихо дают неправильные ответы, что требует ручного анализа трассировок. Kelet автоматизирует это расследование, группируя паттерны сбоев по тысячам сессий.
Как это работает
- Вы подключаете свои трассировки и сигналы (отзывы пользователей, правки, клики, настроение, LLM-как-судья и т.д.)
- Kelet обрабатывает эти сигналы и извлекает факты о каждой сессии
- Он формирует гипотезы о том, что пошло не так в каждом случае
- Он группирует похожие гипотезы по сессиям и исследует их вместе
- Он выявляет коренную причину с предложенным исправлением, которое вы можете просмотреть и применить
Ключевое понимание: отдельные сбои сессий выглядят случайными, но когда вы группируете гипотезы, проявляются паттерны сбоев.
Варианты интеграции
Три способа интеграции:
- Kelet Skill для кодирующих агентов: Сканирует вашу кодовую базу, обнаруживает, где следует собирать сигналы, и автоматически всё настраивает
- Python SDK:
pip install kelet - TypeScript SDK:
npm install kelet
Ручная настройка требует добавления двух строк в код вашего агента. Kelet полностью совместим с OpenTelemetry, поэтому любой агент с инструментированием OTEL работает из коробки.
Поддерживаемые фреймворки и платформы
Работает с: OpenTelemetry, Langfuse, Mixpanel, OpenAI, Anthropic, LangChain, pydantic AI SDK, CrewAI, Strands, Agno, Mastra, PostHog, LangGraph, AutoGen, LlamaIndex, Haystack, Semantic Kernel и Gemini APIs.
Работает с любым агентом или LLM-приложением, код которого вам принадлежит: агентные циклы, многошаговые рабочие процессы, RAG-пайплайны, чат-боты, автономные агенты.
Две ситуации, когда Kelet не подходит:
- Если вы используете AI-инструменты, созданные другими (Cursor, Claude Code, Copilot как разработчик)
- Если вы создаёте скилл или плагин внутри существующей агентной платформы
Технические детали
- Работает на серверах Kelet (сертифицировано SOC 2)
- Непрерывно принимает трассировки 24/7
- Токены LLM для анализа покрываются Kelet (не трогают ваш счёт API модели)
- Ценообразование на основе использования (см. kelet.ai/pricing)
- В настоящее время бесплатен в период бета-тестирования (кредитная карта не требуется)
Метрики производительности
Из данных пилотной когорты:
- 73% команд имели сбои, которые никто не заметил (Kelet их обнаружил)
- 14,3 минуты — медианное время от приёма трассировки до патча промпта
- 33K+ сессий проанализировано в развёртываниях партнёров по дизайну
📖 Read the full source: HN AI Agents
👀 Смотрите также

SideX: Портируемая версия Visual Studio Code на основе Tauri
SideX — это порт Visual Studio Code, который заменяет Electron на Tauri, используя бэкенд на Rust и нативный веб-просмотр операционной системы. Проект заявляет о той же архитектуре, но с размером на 96% меньше, при этом основные функции редактирования и терминала уже работают.

TradesMCP: Открытый MCP-сервер для проверки лицензий подрядчиков и данных о строительстве
TradesMCP — это сервер Model Context Protocol с открытым исходным кодом, который предоставляет Claude доступ к реальным данным о лицензиях подрядчиков, разрешениях на строительство, ценам на материалы и ставкам оплаты труда. Инструмент корректно проверил действующую лицензию подрядчика в Калифорнии, в то время как ChatGPT вернул неверную информацию.

Stage CLI: Локальные изменения, созданные ИИ, проверяемые как логические главы
Stage CLI группирует ваши локальные изменения в логические главы (через любой ИИ-агент) и открывает веб-интерфейс для пошагового ревью. Установите с помощью 'npm install -g stagereview' и добавьте навык через 'npx skills add ReviewStage/stage-cli'.

LivingAgents.ai: Веб-симуляция ИИ-агентов на основе Claude API
LivingAgents.ai — это веб-симуляция, в которой каждый агент работает на основе API Claude, выполняя действия, такие как поиск ресурсов, торговля, создание предметов, атаки, размножение и постоянная смерть, причём каждое действие требует реального вызова LLM.