エージェントクロールアップデートにより、重要なクローラー機能と拡張機能が追加されました

Ad
AgentCrawlの最新アップデートにより、TypeScriptスクレイパー/クローラーとしての機能が強化され、AIエージェントを使用する開発者向けにいくつかの重要な機能が導入されました。このリリースでは、クローラーの正確性と配慮、キャッシュメカニズム、再開可能なクロール、強化されたデータ抽出機能を統合することで、本番環境対応に焦点を当てています。
主な詳細
- ツールアダプターの削除: エージェントSDKとVercel AI SDKのツールアダプターが削除され、ユーザーが独自にツールを定義できるようになりました。
- ライブラリの更新: パッケージには、より優れたデータ検証のためにZodの最新バージョンが含まれています。
- クローラーの正確性: robots.txtの遵守はオプトインになり、Disallow/AllowおよびCrawl-delayディレクティブをサポートします。また、
/sitemap.xmlからのオプトインサイトマップシーディングも利用可能です。 - URL正規化: 改善されたURL正規化により、トラッキングパラメータを包括的に除去し、カノニカル正規化を処理できます。
- スロットリングオプション: クローラーは、設定可能な
perHostConcurrencyとminDelayMsによるホストごとのスロットリングをサポートします。 - キャッシュ: 静的フェッチ用のオプトインディスクHTTPキャッシュは、ETagとLast-Modifiedをサポートします。システムは
ScrapedPageのクリーニング後およびマークダウン変換をキャッシュし、ステータス304のサーバーレスポンスをキャッシュされたボディで処理できます。 - 再開可能なクロール: 新しいオプトインクロール状態の永続化により、キュー、訪問済みページ、キューされたアイテム、エラー、最大深度を含むクロールのフロンティアが保存され、ページを再訪問せずにクロールを再開できます。
- データ抽出の改善: スクレイパーは、カノニカルURL、OpenGraph、Twitterカード、JSON-LDを含む構造化メタデータ抽出をサポートし、
metadata.structuredに保持されます。 - エージェント向けチャンキング: オプトインチャンキング機能は、おおよそのトークンサイズ、見出しパス、引用アンカーを含む
page.chunks[]を返し、RAG/ツールループに有益です。
Ad
Ad
👀 See Also

Tools
d3ラボによる実世界APIを用いたAIエージェントのテスト
d3 labsは、開発者が非現実的なモックに頼る代わりに、実際のシナリオでAIエージェントをテストできるようにする10個の無料プロダクションAPIを提供します。
OpenClawRadar
🦀
Tools
GLiGuard:开源300M参数安全审核模型声称比LLM护栏快16倍
Fastino LabsがGLiGuardをリリース。3億パラメータのエンコーダベースモデルで、複数の安全性タスクを1回のパスで実行し、23~90倍大きいモデルに匹敵または上回る性能を発揮しながら、最大16倍高速に動作します。
OpenClawRadar

Tools
Qwen 3.6 27B量子化ベンチマーク:実用的トレードオフでQ4_K_MがQ8_0を凌駕
BF16、Q4_K_M、Q8_0のGGUF量子化バリアントでQwen 3.6 27BをHumanEval、HellaSwag、BFCLで評価。Q4_K_MはBF16とほぼ同等のスコアを達成しつつ、RAM使用量48%削減、1.45倍の速度、68.8%のファイルサイズ削減を実現。
OpenClawRadar

Tools
オープンソースのベンチマークランナー:OpenClawエージェントを実際のワークフローでテスト
新しいオープンソースプロジェクトにより、YAMLで定義されたプライベートな現実世界のタスクに対してOpenClawエージェントをベンチマークでき、実際のエージェントワークスペースのインポートもサポートします。
OpenClawRadar