DocMason:複雑なオフィスファイル向けローカルエージェント知識ベース

DocMasonの機能
DocMasonは、非公開の業務文書に対する深い調査を目的としたローカルファイルベースのナレッジベースシステムです。中核となるコンセプトは「リポジトリがアプリ、Codexがランタイム」です。オフィスファイルを構造化された証拠バンドルにコンパイルし、厳格な出典追跡を維持しながらAIエージェントが推論できるようにします。
ソースからの主な機能
- 複数のオフィス文書タイプを処理:PPTX、DOCX、XLSX、PDF、さらには.EMLファイル
- ITアーキテクチャ図やExcelシートデータを含むマルチモーダル情報を抽出
- 文書構造と視覚的意味論を維持(スライドレイアウト、プレゼンター用ノート、スプレッドシート参照、書式設定シグナル)
- クラウド取り込みや隠れたバックエンドなしでローカル実行
- ファイルの追加や修正時に増分ナレッジベース同期を提供
- 厳格なデータ契約と出典境界を強制
動作の仕組み
DocMasonは、AIに元の文書構造を尊重させるプロダクショングレードのランタイムとして動作します。複雑なファイルを非構造化テキストブロブに平坦化する代わりに、決定論的なファイルベースの証拠を作成し、オフライン検索アルゴリズムをローカルマシン上で実行します。
始め方
ソースでは2つのセットアップパスが説明されています:
パスA(小規模開始):
- 業務ファイルを
DocMason/original_doc/フォルダにドロップ - CodexでDocMasonフォルダを開く
- 自然に質問する - DocMasonが環境セットアップをガイド
- ナレッジベース構築時にプロンプトを承認
パスB(フォルダ全体をステージング):
- 部門レベルのフォルダを
DocMason/original_doc/にドロップ - Codexで開き、「DocMason環境を準備してください」と指示
- 次に:「ナレッジベースを構築してください」
- 完了後、コーパス全体に対して複雑な調査質問を行う
システムは、内部コマンドを暗記する必要がないように設計されており、有効なワークスペース内でAIエージェントに自然に話しかけるだけで済みます。
技術的詳細
DocMasonは、既存の文書AIツールの特定の制限に対処します:
- スライドデッキの視覚的レイアウト、プレゼンター用ノート、チャートとテキストの関係を保持
- スプレッドシートの複数シート参照とネストされたテーブルを維持
- 「リスク」を示す赤文字や階層を示すインデントなどの書式設定意味論を保持
- 複数パート提案のためのクロスドキュメント推論を可能にする
リポジトリ構造には、アダプター、knowledge_base、runtime、skills、sample_corpusディレクトリが含まれ、設定はdocmason.yamlとpyproject.tomlファイルで管理されます。
📖 完全なソースを読む: HN AI Agents
👀 See Also

賞品付きボット向けパズルゲーム:AIコーダーへの新たな挑戦
魅力的な新しいパズルゲームが、AIコーダーに創造性と知性を発揮させ、賞品をかけて競うボットソリューションの開発を促しています。この取り組みはAIコミュニティで話題を呼び、創造性と競争心に火をつけています。

個人用FastMCPサーバーのためのDrop-in OAuthプロバイダー、すべてのClaudeプラットフォーム対応
ある開発者が、Auth0やGoogleのような外部の認証サービスを必要とせずに、個人用のFastMCPサーバーをClaude.aiのWeb、モバイル、デスクトッププラットフォームで動作させるためのシングルファイルPython OAuthプロバイダーを作成しました。

PACT:エージェント障害パターン後のクロードコードのためのプログラム的ガバナンスフレームワーク
ある開発者が、350以上のファイルからなるモバイルアプリで3ヶ月間にわたり繰り返し発生したClaude Codeの失敗を経て、PACT(Programmatic Agent Constraint Toolkit)を構築しました。このフレームワークは、強制不可能なルールを、ツール使用前のフックを通じて違反を物理的にブロックする機械的な制約に置き換えます。

Kubeez MCPサーバーがClaudeを70以上のAIメディアモデルに接続します
Kubeezは、Claudeを画像、動画、音楽、音声生成のための70以上のAIモデルに接続するMCPサーバーをリリースしました。このサーバーはOAuth認証をサポートし、非同期生成を提供し、Claudeがステータスをポーリングして完了時にCDN URLを返します。