Kepler construye IA verificable para servicios financieros con Claude: más de 26 millones de documentos indexados, respuestas listas para auditoría

Kepler, fundada en 2025 por los exingenieros de Palantir Vinoo Ganesh y John McRaven, ha creado una plataforma de investigación financiera que prioriza la auditabilidad sobre la IA de caja negra. Tras hablar con 147 firmas financieras y escuchar "¿Cómo se supone que confíe en algo que no puedo auditar?", diseñaron un sistema donde Claude actúa como la capa de razonamiento, pero todos los resultados se verifican contra una infraestructura determinista.
Decisiones arquitectónicas clave
- Escala: Indexaron más de 26 millones de documentos SEC, 50 millones de documentos públicos y 1 millón de documentos privados de más de 14,000 empresas y 27 mercados globales en menos de tres meses. Stack: AWS, Rust, Python, contenedores para orquestación.
- Ingeniería de contexto: A Claude se le asignan tareas precisamente definidas con conocimiento del dominio estructurado, definiciones y límites estrictos sobre qué resolver vs. escalar. El modelo se trata como una etapa en un pipeline, no como el sistema completo.
- Razonamiento de múltiples pasos: Para consultas como días de inventario pendientes durante 8 trimestres, Claude debe descomponer la pregunta, extraer los períodos fiscales correctos, manejar reexpresiones y aplicar la fórmula adecuada. En evaluaciones comparativas, todos los modelos de frontera funcionaron de manera similar en consultas simples, pero solo Claude mantuvo los planes coherentes en 4-5+ pasos interdependientes sin perder restricciones.
Manejo de ambigüedad
Kepler descubrió que Claude se detiene y pide aclaraciones cuando un término tiene múltiples significados en finanzas, mientras que otros modelos eligen silenciosamente una interpretación. "Ese comportamiento importa más que cualquier puntuación de evaluación comparativa", dijo el CEO Vinoo Ganesh. "Una suposición incorrecta al principio de un análisis financiero arruina todo lo que sigue".
Diseño de la capa de confianza
La plataforma combina el razonamiento de Claude con infraestructura determinista que valida cada número hasta el documento, página y línea exactos. Esta separación de la interpretación del cálculo garantiza que incluso si el modelo comete un error, la capa de verificación lo detecte antes de que llegue al analista.
📖 Lee la fuente original: HN AI Agents
👀 Ver también

Usar un modelo más pequeño como capa de higiene en tiempo de ejecución mejora la confiabilidad del agente OpenClaw.
Un desarrollador descubrió que añadir un segundo modelo más pequeño para actuar como capa de higiene en tiempo de ejecución para un agente Qwen 3.5 27B en OpenClaw mejoró significativamente la fiabilidad, pasando de necesitar reinicios de sesión cada 20-30 minutos a operación sostenida en sesión única.

Error de pedido de OpenClaw Grocery: Confusión de unidades con el servidor MCP
Un usuario le dio a OpenClaw su tarjeta de crédito para manejar las compras semanales a través de un servidor MCP. Después de tres meses de pedidos impecables, recientemente pidió 2 kg de ajo en lugar de 2 cabezas, porque la página del producto tenía el kilogramo como unidad predeterminada.

Automatización de la Verificación Empresarial con OpenClaw: Un Estudio de Caso
Un desarrollador automatizó su proceso de verificación empresarial utilizando OpenClaw, creando un sistema que analiza perfiles enviados, los verifica según las políticas y genera decisiones con razonamiento y puntuaciones de confianza.

Optimizando la retención de contexto de Claude cargando habilidades bajo demanda.
El cambio a un sistema basado en habilidades para Claude AI resolvió problemas de contexto, permitiendo que las sesiones duren de 2 a 3 veces más y mejorando la calidad de los resultados.