Voker lança plataforma de análise de agentes com primitivas de Intenção/Correção/Resolução

✍️ OpenClawRadar📅 Publicado: May 13, 2026🔗 Source
Ad

A Voker.ai, startup do YC S24, lançou uma plataforma de análise projetada especificamente para agentes de IA. O produto principal é um SDK leve (Python & TypeScript) que envolve chamadas de LLM para OpenAI, Anthropic e Gemini, coletando automaticamente dados de conversa e anotando três primitivas: Intenções, Correções e Resoluções.

O que faz

A Voker processa chamadas de LLM classificando automaticamente os objetivos do usuário (intenções), detectando quando os usuários corrigem o agente (correções) e medindo quando o agente resolve a intenção (resoluções). Em seguida, usa classificação hierárquica de texto (não LLMs para engenharia de dados) para agregar esses dados em categorias dinâmicas, fornecendo às equipes de produto insights de autoatendimento sem precisar ler traces individuais.

Detalhes importantes do lançamento

  • Integração SDK: Duas linhas para instalar: pip install voker e envolver o provedor LLM (ex.: from voker.ai.provider_openai import OpenAI).
  • Independente de pilha LLM: Funciona com OpenAI, Anthropic, Gemini, Langchain, CrewAI e Vercel AI SDK.
  • Preço: Plano gratuito — 2.000 eventos/mês (requer cadastro de e-mail). Planos pagos a partir de US$ 80/mês com teste gratuito de 30 dias.
  • Filosofia de engenharia de dados: A Voker evita explicitamente usar LLMs para processamento central de dados, garantindo estatísticas consistentes, reproduzíveis e precisas. Os cofundadores observam que enviar logs para o ChatGPT muitas vezes gera insights superajustados ou inconsistentes.
Ad

Por que existe

De acordo com uma pesquisa com fundadores do YC, mais de 90% disseram que a única forma de saber que os agentes estão falhando é por meio de reclamações de clientes. As ferramentas existentes são insuficientes: observabilidade (ex.: Langfuse, Langsmith) é boa para depuração de traces, mas não acessível a não engenheiros; avaliações testam problemas conhecidos, mas perdem tendências inesperadas; análises tradicionais (PostHog, Mixpanel) não são feitas para dados conversacionais não estruturados.

Para quem é

Equipes que gerenciam agentes conversacionais de alto volume (mais de 1.000 sessões de chat por mês) com interações complexas de múltiplas etapas, precisando de insights que equipes multifuncionais (PMs, engenheiros, analistas) possam acessar por autoatendimento.

📖 Leia a fonte original: HN AI Agents

Ad

👀 See Also

Ferramenta gratuita de detecção de sinais de farmacovigilância desenvolvida com Claude Code
Tools

Ferramenta gratuita de detecção de sinais de farmacovigilância desenvolvida com Claude Code

Um desenvolvedor utilizou o Claude Code para criar uma plataforma gratuita de farmacovigilância que analisa 2,9 milhões de relatórios de eventos adversos da FDA, executando detecção estatística de sinais pela qual plataformas comerciais cobram de US$ 50 mil a US$ 500 mil por ano. A ferramenta está hospedada gratuitamente no HuggingFace.

OpenClawRadar
Signet: Um Substrato de Memória Local-First de Código Aberto para Agentes de IA
Tools

Signet: Um Substrato de Memória Local-First de Código Aberto para Agentes de IA

Signet é um substrato de memória de código aberto para agentes de IA que move o tratamento de memória para fora do loop do agente. Ele preserva transcrições, destila sessões em memória estruturada, vincula entidades em um grafo e injeta contexto antes do início dos prompts.

OpenClawRadar
Arena AI, Histórico de ELO do Modelo, Acompanha a Degradação de Desempenho de LLMs ao Longo do Tempo
Tools

Arena AI, Histórico de ELO do Modelo, Acompanha a Degradação de Desempenho de LLMs ao Longo do Tempo

Um painel ao vivo visualiza as classificações ELO dos modelos emblemáticos dos principais laboratórios de IA, revelando degradação gradual do desempenho e saltos repentinos em novos lançamentos. A ferramenta traça dinamicamente uma curva por laboratório, acompanhando o modelo com a classificação mais alta.

OpenClawRadar
Construindo um aplicativo macOS local de voz para texto com Claude Code: Estudo de caso Vext
Tools

Construindo um aplicativo macOS local de voz para texto com Claude Code: Estudo de caso Vext

Um desenvolvedor passou 3 meses construindo o Vext, um aplicativo macOS de voz para texto usando Whisper no Apple Neural Engine. O Claude Code ajudou com FFI Rust/Swift, otimização Core ML e arquitetura de atalhos de teclado. O aplicativo funciona 100% offline e transcreve 60 segundos de áudio em ~400ms.

OpenClawRadar