KeplerがClaudeで金融AI構築：2600万件のファイリングを索引化し監査対応回答

2025年に元PalantirエンジニアのVinoo GaneshとJohn McRavenによって設立されたKeplerは、ブラックボックス型のAIではなく監査可能性を優先した金融リサーチプラットフォームを構築しました。147の金融機関と話し、「監査できないものをどうやって信頼すればいいのか」という声を聞いた彼らは、Claudeを推論レイヤーとして活用しつつ、すべての出力を決定論的なインフラストラクチャに対して検証するシステムを設計しました。

主要なアーキテクチャ上の決定

規模: わずか3か月で、14,000以上の企業、27のグローバル市場にわたる2,600万件以上のSEC提出書類、5,000万件以上の公開文書、100万件以上の非公開文書をインデックス化。スタック：AWS、Rust、Python、オーケストレーション用のコンテナ。
コンテキストエンジニアリング: Claudeには、構造化されたドメイン知識、定義、解決すべきこととエスカレーションすべきことの明確な境界を与えられた、正確に定義されたタスクが与えられます。モデルはパイプラインの1つのステージとして扱われ、システム全体ではありません。
マルチステップ推論: 在庫日数の8四半期分のクエリなどでは、Claudeは質問を分解し、正しい会計期間を取得し、訂正を処理し、適切な計算式を適用する必要があります。ベンチマークでは、すべての最先端モデルが単純なクエリで同等のパフォーマンスを示しましたが、Claudeだけが4〜5以上の相互依存ステップにわたって計画を維持し、制約を落としませんでした。

あいまいさへの対応

Keplerは、金融用語に複数の意味がある場合、Claudeは立ち止まって明確化を求める一方、他のモデルは黙って1つの解釈を選ぶことを発見しました。「その動作は、あらゆるベンチマークスコアよりも重要だ」とCEOのVinoo Ganeshは述べています。「金融分析の初期段階で1つの誤った仮定があると、下流のすべてが壊れてしまいます。」