Análisis de Agentes con Intención/Corrección/Resolución

Voker.ai, una startup del lote YC S24, ha lanzado una plataforma de análisis diseñada específicamente para agentes de IA. El producto principal es un SDK ligero (Python y TypeScript) que envuelve las llamadas a LLMs de OpenAI, Anthropic y Gemini, recopilando automáticamente datos de conversaciones y anotando tres primitivas: Intenciones, Correcciones y Resoluciones.

Qué hace

Voker procesa llamadas a LLMs clasificando automáticamente los objetivos de los usuarios (intenciones), detectando cuándo los usuarios corrigen al agente (correcciones) y midiendo cuándo el agente resuelve la intención (resoluciones). Luego utiliza clasificación jerárquica de texto (no LLMs para ingeniería de datos) para agregar estos datos en categorías dinámicas, brindando a los equipos de producto información de autoservicio sin necesidad de leer trazas individuales.

Detalles clave del lanzamiento

Integración del SDK: Dos líneas para instalar: pip install voker y envolver el proveedor de LLM (por ejemplo, from voker.ai.provider_openai import OpenAI).
Independiente del stack de LLM: Funciona con OpenAI, Anthropic, Gemini, Langchain, CrewAI y Vercel AI SDK.
Precios: Nivel gratuito: 2000 eventos/mes (requiere registro con correo electrónico). Los planes de pago comienzan en $80/mes con una prueba gratuita de 30 días.
Filosofía de ingeniería de datos: Voker evita explícitamente el uso de LLMs para el procesamiento central de datos, garantizando estadísticas consistentes, reproducibles y precisas. Los cofundadores señalan que subir registros a ChatGPT a menudo produce información sobreajustada o inconsistente.

Por qué existe

Según una encuesta entre fundadores de YC, más del 90% dijo que la única forma en que saben que los agentes están fallando es a través de quejas de clientes. Las herramientas existentes se quedan cortas: la observabilidad (por ejemplo, Langfuse, Langsmith) es buena para depurar trazas pero no accesible para no ingenieros; las evaluaciones prueban problemas conocidos pero pasan por alto tendencias inesperadas; el análisis tradicional (PostHog, Mixpanel) no está diseñado para datos conversacionales no estructurados.

Para quién es

Equipos que gestionan agentes conversacionales de alto volumen (más de 1000 sesiones de chat al mes) con interacciones complejas de múltiples turnos, que necesitan información que los equipos multifuncionales (PMs, ingenieros, analistas) puedan consultar por sí mismos.

📖 Leer la fuente completa: HN AI Agents

Voker lanza plataforma de análisis de agentes con primitivas de Intención/Corrección/Resolución

Qué hace

Detalles clave del lanzamiento

Por qué existe

Para quién es

👀 Ver también

El Enfoque de Debate Multiagente Mejora la Calidad del Razonamiento en LLM.

Flujo de Trabajo de Agente de IA Local Usando OpenCode, FastMCP y DeepSeek-r1

Scrapling integrado como columna vertebral de scraping de OpenClaw.

Forge: Complemento de Código Claude de Código Abierto Agrega Puertas de Gobernanza y Pruebas