クロイツベルク v4.7.0は、248言語のコードインテリジェンスと改良されたマークダウン抽出機能を追加しました。

Kreuzberg v4.7.0が利用可能になりました。これはPython、TypeScript/Node.js、Go、Ruby、Java、C#、PHP、Elixir、R、C、WASMで動作するRustコアのドキュメントインテリジェンスライブラリです。
コードインテリジェンスと抽出
主なハイライトはコードインテリジェンスと抽出です。Kreuzbergはtree-sitter-language-packライブラリを介して248フォーマットをサポートするようになりました。これにより、エージェント向けライブラリとしての直接統合やMCP経由での効率的なコード解析が可能になります。エージェントはコードリポジトリの操作、プルリクエストのレビュー、コードベースのインデックス作成、ソースファイルの分析などが行えます。
KreuzbergはASTレベルで抽出を行います:
- 関数
- クラス
- インポート
- エクスポート
- シンボル
- ドックストリング
スコープ境界を尊重したコードチャンキングを実現しています。
マークダウン品質の改善
不十分なドキュメント抽出はパイプラインで問題を引き起こす可能性があります。チームは350以上のドキュメントと23フォーマットでStructural F1とText F1スコアリングを使用したベンチマークハーネスを作成し、それに基づいて最適化を行いました。
具体的な改善点:
- LaTeX:0%から100% SF1へ改善
- XLSX:30%から100% SF1へ向上
- PDFテーブルSF1:15.5%から53.7%へ向上
23フォーマットすべてで80%以上のSF1を達成しました。パイプラインが受け取る出力は、デフォルトで構造的に正確になりました。
その他の主な機能
- 新しいマークダウン描画レイヤーと新しいHTML出力サポート
- OpenWebUI統合(ドキュメント抽出バックエンドとして)
- docling-serve互換性オプションまたは直接接続オプション
- すべての抽出器が標準的な型付きドキュメント表現を作成する統一アーキテクチャ
- TOONワイヤフォーマット - LLMプロンプトトークン使用量を30〜50%削減するコンパクトなドキュメントエンコーディング
- セマンティックチャンクラベリング
- JSON出力
- 厳格な設定検証
- セキュリティの改善
利用可能性
KreuzbergはGitHubで利用可能です:https://github.com/kreuzberg-dev/kreuzberg
Kreuzberg Cloudが近日公開予定 - インフラ管理なしで同じ抽出品質を求めるチーム向けのホステッドバージョンです。詳細はこちら:https://kreuzberg.dev
コントリビューションを歓迎します。
📖 Read the full source: r/LocalLLaMA
👀 See Also

Blender MCP Server with 100+ Tools Built Using Claude Codeの日本語訳は以下の通りです: **Claude Codeで構築された100以上のツールを備えたBlender MCPサーバー** より自然な表現としては: **Claude Codeを使用して構築、100以上のツールを備えたBlender MCPサーバー** または簡潔に: **Claude Code製、100+ツール搭載Blender MCPサーバー**
開発者がBlender用のMCPサーバーを作成し、14のカテゴリーにわたる100以上のツールを提供しています。これにより、Claude Code、Claude Desktop、Cursor、WindsurfなどのAIコーディングエージェントが自然言語プロンプトを通じてBlenderを制御できるようになりました。コードベース全体はClaude Codeを使用して書かれており、BlenderのメインスレッドAPI要件などのアーキテクチャ上の課題を解決するのに役立ちました。

エージェントルーム:Claudeコードエージェントチーム可視化デスクトップアプリ
Agents Roomは、.claude/agents/フォルダをスキャンし、フロントマターを読み取り、エージェント間の関係をキャンバス上に自動接続線で可視化するElectronデスクトップアプリケーションです。マークダウンファイルを編集する代わりに、UIから直接エージェント、スキル、コマンドを作成・編集できます。

オープンソースのビジルツールがOpenClawエコシステムにおけるエージェントアイデンティティ問題に取り組む
OpenClawユーザーがウェブサービスを構築中、人間のユーザーと見分けがつかないエージェントのトラフィックを発見し、これがVigilの開発につながりました。VigilはW3C DIDに基づくオープンソースのアイデンティティレイヤーで、エージェントに暗号化された資格情報と行動履歴を提供します。

Markdown Manager:macOS向けシンプルなMarkdownエディター
Markdown Managerは、無料でオープンソースのmacOSアプリで、Markdownファイルの管理、文書変換、プレビュー機能を備えています。