LLMは、テラバイト規模のCIログを数秒で分析するためのSQLクエリを生成します。

✍️ OpenClawRadar📅 公開日: February 27, 2026🔗 Source
LLMは、テラバイト規模のCIログを数秒で分析するためのSQLクエリを生成します。
Ad

MendralのAIエージェントは、独自のSQLクエリを作成し、数億行のログをスキャンし、ジョブメタデータから生ログ出力へのトレースを追跡することで、不安定なテストの原因を3週間前の依存関係の更新に特定しました。調査全体は数秒で完了しました。

毎週、約15億行のCIログと70万件のジョブが彼らのシステムを通過します。すべてのデータはClickHouseに格納され、35:1に圧縮されます。すべてのデータはミリ秒単位でクエリ可能です。

エージェント向けSQLインターフェース

彼らは、調査対象の組織にスコープされたSQLインターフェースをエージェントに提供しています。エージェントは質問に基づいて独自のクエリを構築します。事前定義されたクエリライブラリや厳格なツールAPIはありません。get_failure_rate(workflow, days)のような制約のあるツールAPIでは、エージェントは予想される質問に限定されてしまいます。SQLインターフェースでは、想定されていなかった質問も可能になり、新しい障害のデバッグ時に重要となります。

エージェントは主に2つのターゲットをクエリします:

  • ジョブメタデータ:CIジョブ実行ごとに1行を持つマテリアライズドビュー。エージェントは63%の時間で、「この失敗はどのくらいの頻度で起こるか?」「成功率は?」「最も遅いジョブは?」「いつから失敗し始めたか?」などの質問に使用します。
  • 生ログ行:ログ行ごとに1行。エージェントは37%の時間で、「このジョブのエラー出力を表示」「このログパターンが最初に現れたのはいつ?」「このエラーメッセージは実行全体でどのくらいの頻度で発生するか?」などの質問に使用します。

クエリパターンとスケール

彼らはオブザーバビリティパイプラインから8,534のエージェントセッションと52,312のクエリを分析しました。エージェントは1つのクエリで止まりません。調査を開始し、広範囲から絞り込みます。

1つの質問に答えるための全クエリでスキャンされた総行数:

  • 典型的な質問:約3クエリで33.5万行
  • P75:520万行
  • P95:9.4億行
  • 最も重い生ログセッションは43億行をスキャン

エージェントはセッションごとに平均4.4クエリを実行します。典型的な調査は、ジョブメタデータ(安価なクエリ、中央値4.7万行)に対してコンパクトで事前集計されたマテリアライズドビューを使用して開始します。興味深いものを見つけると、生ログ(高価なクエリ、中央値110万行)に掘り下げます。

Ad

データアーキテクチャ

エージェントが高速にクエリするためには、データがそのために構造化されている必要があります。忙しい日には最大3億行のログが流れます。彼らはClickHouseを使用しています。

すべてのログ行には48列のメタデータが含まれています:それが属するCI実行の完全なコンテキスト。コミットSHA、作成者、ブランチ、PRタイトル、ワークフロー名、ジョブ名、ステップ名、ランナー情報、タイムスタンプなど。

ClickHouseのカラムナ形式では、48列をすべてのログ行に非正規化することは実質的にコストがかかりません。commit_messageのような列は、CI実行内のすべてのログ行で同じ値を持ち、1回の実行で数千行のログが生成されることがあります。ClickHouseはそれらの数千の同一値を連続して格納します。圧縮アルゴリズムは繰り返しを認識し、ほとんど無に近く圧縮します。

圧縮率:

  • commit_message:301:1
  • display_title:160:1
  • workflow_path:79:1
  • step_name:52:1
  • job_name:48:1

非正規化がなければ、すべてのクエリで結合が必要になります。これにより、すべてが単純なフィルタになります。

📖 完全なソースを読む: HN LLM Tools

Ad

👀 See Also

5つのビジネスにOpenClawを導入して得られた実践的な教訓
Use Cases

5つのビジネスにOpenClawを導入して得られた実践的な教訓

開発者が、介護事業所、イベント事業、自動車ディテーリング事業を含む5つの実際のビジネスでOpenClawエージェントを運用して学んだ、具体的なインフラ選択、課金アプローチ、モデル階層化戦略を共有します。

OpenClawRadar
Redditユーザーが、Claude Codeの幻覚を減らすための仕様駆動アプローチを共有
Use Cases

Redditユーザーが、Claude Codeの幻覚を減らすための仕様駆動アプローチを共有

r/ClaudeAIの開発者が、構造化された仕様書作成手法を用いてClaude Codeの幻覚を大幅に削減した方法を説明しています。このアプローチでは、REQUIREMENTS.md、IMPLEMENTATION_PLAN.md、CLAUDE.mdファイルを作成し、複数のコンパクションを通じてコンテキストを維持します。

OpenClawRadar
プロジェクト・ジェームズ・セクストン:OpenClawとClaudeによる法律アシスタントの構築
Use Cases

プロジェクト・ジェームズ・セクストン:OpenClawとClaudeによる法律アシスタントの構築

開発者が離婚裁判の書類処理を自動化するために、OpenClawとClaude APIを使用して法的アシスタントを構築しています。このシステムはメールを監視し、PDFをダウンロードし、Claudeで文書を分析し、返信用紙を見つけ、回答を生成し、下書きを印刷します。

OpenClawRadar
物語と状態追跡の分離がAIテキストアドベンチャーの記憶喪失を修正する
Use Cases

物語と状態追跡の分離がAIテキストアドベンチャーの記憶喪失を修正する

ある開発者が、PostgreSQLでゲームの状態を追跡し、状態変化後にのみLLMが物語テキストを生成するステートフルなシミュレーションエンジンを構築しました。これにより、インベントリの幻覚やプロットの喪失を防ぎます。

OpenClawRadar