Claude Code 2.1.136: アクションの安全性、ハード拒否ルール、セキュリティモニター

Claude Code v2.1.136 は、システムプロンプト、エージェントプロンプト、ツールの説明にわたって、エージェントの安全性とルールの適用に大きな変更をもたらします。新機能と自律エージェントの動作への影響を説明します。
システムプロンプト:アクションの安全性と真実の報告
更新されたシステムプロンプトでは、元に戻せない、または外部向けのアクションを実行する前に、エージェントに確認を求める必要があります(永続的に承認された場合を除く)。エージェントは、削除または上書きする前にターゲットを検査する必要があります。報告要件では、スキップされた手順、失敗したテスト、検証済みの結果を忠実に開示することが強調され、失敗を隠蔽することは許可されません。
エージェントプロンプト:自動モードルールレビューア
新しいカスタムルールカテゴリ hard_deny が、既存の allow、deny、soft_deny に加えて 4 番目のオプションとして導入されました。hard_deny は、セキュリティ境界でアクションを無条件にブロックします。ユーザーの意図では上書きできません。既存の soft_deny カテゴリは、ユーザーの明確な意図で認可可能な破壊的または不可逆的なアクションのみを対象とするよう範囲が狭められました。
エージェントプロンプト:自律エージェントアクションのセキュリティモニター
セキュリティモニターのロジックが 2 つの部分に再構成されました。最初の部分では、ブロッキングを無条件の ハードブロック とユーザー認可可能な ソフトブロック に分割します。デフォルトルールが更新され、ユーザーの意図ではハードブロックのセキュリティ境界をクリアできなくなりました。2 番目の部分では、データ漏洩をハードブロックセットに移動し、安全チェックバイパスに対するハードブロックカバレッジを追加し、エージェントが推測した外部サービスやダウンロードソースをすべて信頼できないものとして扱います。
ツールの説明:編集
編集ツールの説明では、行番号プレフィックスの形式がテンプレート変数として復元され、実際の編集文字列から行プレフィックスを除外するガイダンスが維持されます。これは一貫性のためのクリーンアップ修正です。
これらの変更により、自律型 Claude Code エージェントの安全性の範囲が強化されます。カスタムルールに依存する開発者は、セキュリティ上重要なブロックに hard_deny を活用するよう設定を更新する必要があります。完全なプロンプト差分はリリースで確認できます。
📖 Read the full source: r/ClaudeAI
👀 See Also

Claude-Code v2.1.33:精密さで自動化を強化
Claude-Code v2.1.33の最新リリースでは、AIコーディングエージェントをさらに革新する主要機能が導入され、効率性と正確性の両方が向上しています。

Claude AI広範囲に障害発生:ウェブUIダウン、APIエラー増加
Claude.aiは利用不可、APIは高いエラー率を返しています(2025年4月28日19:15 UTC時点)。公式ステータスページで継続中のインシデントを確認。

ベンチマーク結果:Apple SiliconとAMD GPU(ROCmおよびVulkan)におけるQwen3.5モデルの比較
ある開発者が、Qwen3.5モデル(35B MoE、27B dense、122B MoE)をApple Silicon MacとAMD GPUワークステーションでベンチマークし、ROCmとVulkanバックエンドをコンテキストスケーリングテストで比較しました。ハードウェアには、M5 Max、M1 Max、および異なるPCIe構成の3つのAMD GPUが含まれていました。

AIエージェントの信頼性と開発パターンに関する研究成果
Claude Opusとの共同研究セッションで、AIエージェントに関する15本の論文を分析し、定量化された信頼性の問題を明らかにしました:エージェントは10回の実行で2〜4種類の異なるアクションシーケンスを生成し、69%の分岐は最初の決定時点で発生しました。自己改善型エージェントでは、安全性拒否率が99.4%から54.4%に低下しました。