Kepler construit une IA vérifiable pour les services financiers avec Claude : 26M+ de documents indexés, réponses prêtes pour l'audit

Kepler, fondé en 2025 par les anciens ingénieurs de Palantir Vinoo Ganesh et John McRaven, a construit une plateforme de recherche financière qui privilégie l'auditabilité plutôt que l'IA boîte noire. Après avoir parlé à 147 entreprises financières et entendu « Comment suis-je censé faire confiance à quelque chose que je ne peux pas auditer ? », ils ont conçu un système où Claude agit comme couche de raisonnement, mais tous les résultats sont vérifiés par une infrastructure déterministe.
Décisions architecturales clés
- Échelle : Indexation de plus de 26 millions de dépôts SEC, 50 millions de documents publics et 1 million de documents privés pour plus de 14 000 entreprises et 27 marchés mondiaux en moins de trois mois. Stack : AWS, Rust, Python, conteneurs pour l'orchestration.
- Ingénierie de contexte : Claude reçoit des tâches précisément définies avec une connaissance du domaine structurée, des définitions et des limites strictes sur ce qu'il faut résoudre par rapport à ce qu'il faut escalader. Le modèle est traité comme une étape dans un pipeline, pas comme l'ensemble du système.
- Raisonnement multi-étapes : Pour des requêtes comme les jours d'inventaire en cours sur 8 trimestres, Claude doit décomposer la question, extraire les bonnes périodes fiscales, gérer les retraitements et appliquer la formule appropriée. Sur les benchmarks, tous les modèles de pointe ont obtenu des résultats comparables sur les requêtes simples, mais seul Claude a maintenu les plans à travers 4-5 étapes interdépendantes ou plus sans abandonner les contraintes.
Gestion de l'ambiguïté
Kepler a constaté que Claude s'arrête et demande des éclaircissements lorsqu'un terme a plusieurs significations en finance, alors que d'autres modèles choisissent silencieusement une interprétation. « Ce comportement compte plus que n'importe quel score de benchmark », a déclaré le PDG Vinoo Ganesh. « Une seule hypothèse erronée au début d'une analyse financière casse tout ce qui suit. »
Conception de la couche de confiance
La plateforme combine le raisonnement de Claude avec une infrastructure déterministe qui valide chaque nombre jusqu'au dépôt, à la page et à la ligne exacts. Cette séparation de l'interprétation et du calcul garantit que même si le modèle commet une erreur, la couche de vérification la rattrape avant qu'elle n'atteigne l'analyste.
📖 Lire la source complète : HN AI Agents
👀 See Also

Agent de codage Pi + Qwen 3.6 27B : Configuration d'Arch Linux sans intervention via langage naturel
Un utilisateur exécutant Qwen 3.6 27B via pi coding agent sur un miniPC a pu configurer le Bluetooth, la mise à l'échelle de l'écran et plus encore sur Arch Linux en utilisant des commandes en anglais courant — sans toucher aux configurations Wayland.

Comment j'ai créé 62 outils gratuits en un mois avec Claude Code + un script en boucle
Un développeur a publié 62 outils prêts pour le SEO, basés sur navigateur, en 30 jours, en utilisant un script shell appelé Ralph qui exécute Claude Code de manière autonome en couches, ainsi qu'un cook.sh parallèle pour exécuter plusieurs outils à la fois.

Claude Managed Agents publié : Orchestration multi-agents et 70 jours de leçons pratiques
Anthropic a lancé Managed Agents pour l'orchestration multi-agent et des chaînes d'outils améliorées. Un développeur partage 70 jours d'expérience avec des agents à rôles séparés (couche de décision Opus, ingénieur OpenCode, agents de recherche) et le changement crucial des briefs 'exécute ceci' vers des briefs 'tu peux remettre en question mon hypothèse'.

Les agents IA construisent indépendamment des garde-fous dans une expérience ouverte.
Un développeur a fait fonctionner 5 agents IA pendant 3 semaines avec une consigne ouverte pour résoudre des problèmes de développement. 28 prototypes sur plus de 170 ont convergé indépendamment vers la création de scanners de sécurité et de contrôles de coûts—des garde-fous que les agents ont créés pour eux-mêmes sans qu'on le leur demande.