Architect CLI: CI/CDでヘッドレスAIコーディングエージェントをオーケストレーションするオープンソースツール

Architect CLIの機能
Architectは、CI/CD環境におけるヘッドレスAIコーディングエージェントのオーケストレーション専用に構築されたオープンソースCLIツールです。AIエージェントはコードを生成できますが、パイプラインで無人実行された場合に生成されたコードが実際に動作する保証がないという問題に対処します。
主な機能
- Ralph Loop: コードを実行し、テストし、失敗した場合はクリーンなコンテキストで再試行します。必要に応じて数時間継続することも可能です。
- 確定的なガードレール: 保護されたファイル、ブロックされたコマンド、LLMが迂回できない品質ゲートを含みます。
- YAMLパイプライン: エージェントのワークフローはYAML設定を使用してコードとして定義されます。
- あらゆるLLMのサポート: LiteLLM統合を介してClaude、GPT、DeepSeek、OllamaなどのLLMと連携します。使用するLLMに関わらず、ツールの保証は一貫しています。
設計哲学
このツールは「ヘッドレスファースト」および「CI/CDネイティブ」と表現され、検証レイヤーに焦点を当てています。作成者は、ArchitectがClaude Code、Cursor、Copilotなどの対話型ツールと競合するのではなく、それらと連携することを強調しています。提供された例えは「パイロットと航空管制の違い」です。
入手可能性と開発状況
ArchitectはClaude Codeの助けを借りて構築されており、作成者はCI/CDでAIエージェントを実行している、または検討している開発者からのフィードバックを求めています。このプロジェクトはGitHubで入手可能で、付随するドキュメントが提供されています。
📖 全文を読む: r/LocalLLaMA
👀 See Also

SWE-CI:新たなベンチマークがCIを通じた長期コードメンテナンスにおけるAIエージェントをテスト
SWE-CIは、LLM駆動エージェントが継続的インテグレーションサイクルを通じてコードベースを維持する能力を評価するリポジトリレベルのベンチマークです。静的バグ修正から長期にわたる保守性へと焦点を移し、100の実世界タスクにわたって評価します。

Sandra: Claude用オープンソース永続グラフメモリMCP
Sandraはグラフ+ベクターのメモリバックエンドで、ネイティブMCPサーバーを備え、Claudeにセッションを超えた永続的な構造化メモリを提供します。完全一致検索、あいまい検索、セマンティック検索をサポートします。

Claudeコードワークフローの視覚的詳細:メモリ階層とスキルシステム
Redditユーザーが、Claude Codeが階層化されたCLAUDE.mdファイルを通じてメモリを整理し、SKILL.mdファイルで再利用可能なスキルを実装する方法を示す視覚的な図を共有しました。ワークフローループでは、自動承認と頻繁なコミットを伴うPlanモードの使用が提案されています。

M1 Ultraで1MトークンコンテキストのNemotron 3 Super 120Bをベンチマーク
ユーザーがM1 Ultra上でllama.cppを使用し、Q4_K_M量子化モデルでNemotron 3 Super 120Bをテストし、約90GBのVRAMを消費する100万トークンのコンテキストウィンドウを実現しました。パフォーマンスベンチマークでは、トークン生成速度が512プロンプト処理時の255 t/sから、10万トークンコンテキスト時の22.37 t/sまで低下することが示されています。