Plataforma de Análise de Agentes Voker: Intenção, Correção, Resolução

A Voker.ai, startup do YC S24, lançou uma plataforma de análise projetada especificamente para agentes de IA. O produto principal é um SDK leve (Python & TypeScript) que envolve chamadas de LLM para OpenAI, Anthropic e Gemini, coletando automaticamente dados de conversa e anotando três primitivas: Intenções, Correções e Resoluções.

O que faz

A Voker processa chamadas de LLM classificando automaticamente os objetivos do usuário (intenções), detectando quando os usuários corrigem o agente (correções) e medindo quando o agente resolve a intenção (resoluções). Em seguida, usa classificação hierárquica de texto (não LLMs para engenharia de dados) para agregar esses dados em categorias dinâmicas, fornecendo às equipes de produto insights de autoatendimento sem precisar ler traces individuais.

Detalhes importantes do lançamento

Integração SDK: Duas linhas para instalar: pip install voker e envolver o provedor LLM (ex.: from voker.ai.provider_openai import OpenAI).
Independente de pilha LLM: Funciona com OpenAI, Anthropic, Gemini, Langchain, CrewAI e Vercel AI SDK.
Preço: Plano gratuito — 2.000 eventos/mês (requer cadastro de e-mail). Planos pagos a partir de US$ 80/mês com teste gratuito de 30 dias.
Filosofia de engenharia de dados: A Voker evita explicitamente usar LLMs para processamento central de dados, garantindo estatísticas consistentes, reproduzíveis e precisas. Os cofundadores observam que enviar logs para o ChatGPT muitas vezes gera insights superajustados ou inconsistentes.

Por que existe

De acordo com uma pesquisa com fundadores do YC, mais de 90% disseram que a única forma de saber que os agentes estão falhando é por meio de reclamações de clientes. As ferramentas existentes são insuficientes: observabilidade (ex.: Langfuse, Langsmith) é boa para depuração de traces, mas não acessível a não engenheiros; avaliações testam problemas conhecidos, mas perdem tendências inesperadas; análises tradicionais (PostHog, Mixpanel) não são feitas para dados conversacionais não estruturados.

Para quem é

Equipes que gerenciam agentes conversacionais de alto volume (mais de 1.000 sessões de chat por mês) com interações complexas de múltiplas etapas, precisando de insights que equipes multifuncionais (PMs, engenheiros, analistas) possam acessar por autoatendimento.

📖 Leia a fonte original: HN AI Agents