Kepler、Claude を用いて金融サービス向けの検証可能なAIを構築:2600万件以上のファイリングをインデックス化、監査対応の回答を提供

2025年に元PalantirエンジニアのVinoo GaneshとJohn McRavenによって設立されたKeplerは、ブラックボックス型のAIではなく監査可能性を優先した金融リサーチプラットフォームを構築しました。147の金融機関と話し、「監査できないものをどうやって信頼すればいいのか」という声を聞いた彼らは、Claudeを推論レイヤーとして活用しつつ、すべての出力を決定論的なインフラストラクチャに対して検証するシステムを設計しました。
主要なアーキテクチャ上の決定
- 規模: わずか3か月で、14,000以上の企業、27のグローバル市場にわたる2,600万件以上のSEC提出書類、5,000万件以上の公開文書、100万件以上の非公開文書をインデックス化。スタック:AWS、Rust、Python、オーケストレーション用のコンテナ。
- コンテキストエンジニアリング: Claudeには、構造化されたドメイン知識、定義、解決すべきこととエスカレーションすべきことの明確な境界を与えられた、正確に定義されたタスクが与えられます。モデルはパイプラインの1つのステージとして扱われ、システム全体ではありません。
- マルチステップ推論: 在庫日数の8四半期分のクエリなどでは、Claudeは質問を分解し、正しい会計期間を取得し、訂正を処理し、適切な計算式を適用する必要があります。ベンチマークでは、すべての最先端モデルが単純なクエリで同等のパフォーマンスを示しましたが、Claudeだけが4〜5以上の相互依存ステップにわたって計画を維持し、制約を落としませんでした。
あいまいさへの対応
Keplerは、金融用語に複数の意味がある場合、Claudeは立ち止まって明確化を求める一方、他のモデルは黙って1つの解釈を選ぶことを発見しました。「その動作は、あらゆるベンチマークスコアよりも重要だ」とCEOのVinoo Ganeshは述べています。「金融分析の初期段階で1つの誤った仮定があると、下流のすべてが壊れてしまいます。」
信頼レイヤーの設計
このプラットフォームは、Claudeの推論と、すべての数値を正確な提出書類、ページ、明細項目まで検証する決定論的なインフラストラクチャを組み合わせています。解釈と計算を分離することで、モデルが間違いを犯しても、検証レイヤーがアナリストに届く前にそれをキャッチします。
📖 全文を読む: HN AI Agents
👀 See Also

開発者がコーディングワークフローにおけるClaude AIを現代の電卓に例える
サーバーレスAngular/AWS SPA/PWAプロジェクトに18ヶ月携わっている開発者が、AI支援コーディングの90%にClaude AIを使用していると報告し、それを「21世紀版の電卓」と表現しています。時折発生する壊滅的な出力にもかかわらず、生産性が10倍向上したと述べています。

人道支援AIにおけるany-guardrailを用いた多言語ガードレールの評価
Mozillaのany-guardrailツールは、人道支援LLMにおける多言語ガードレールを評価し、タスクとドメインの特異性に焦点を当てています。

OpenClawアーキテクチャ:持続型AI駆動配信エンジンの構築
OpenClawのアーキテクチャは、デーモン駆動のアプローチ、小さな構成可能なツール、宣言型レシピ、メモリレイヤーを特徴としており、継続的で効率的な自動化ワークフローを実現します。

開発者が30日間の個人プロジェクトでClaude CodeとLinear、Discordをどのように活用したか
ある開発者が、Claude Codeをペアプログラマーとして活用し、Linearをチケット追跡に、Discordをビルド通知に統合して、30日間でフルスタックのポケモンVGCチームレポートツールを構築しました。ワークフローには、自動化されたチケット処理、型チェックゲート、一貫したAI指示のためのCLAUDE.mdファイルが含まれていました。