Claude Security 公開ベータ版:コードベースをスキャン、自身の調査結果を検証、パッチを提案

Anthropicは本日、エンタープライズ顧客向けにClaude Securityをパブリックベータ版としてリリースしました。ルールベースのパターンマッチング(高速で低コストだが、偽陽性が大量に出る)ではなく、セキュリティ研究者のようにコードを推論します。Gitの履歴を読み、ファイル間のデータフローを追跡し、ビジネスロジックを理解します。その目標は、コンテキストがあって初めて意味を持つ脆弱性を捉えることであり、パターンマッチャーでは構造的に発見できないものです。
主な機能
- 深刻な問題をスキャン:メモリ破損、インジェクション欠陥、認証バイパス、複雑な論理エラー
- 発見結果を内部で敵対的自己検証により検証してから提示 — Claudeが自身の結果に挑戦
- 発見ごとに具体的なパッチを提案し、コードの構造とスタイルを維持
- 発見結果をSlack、Jira、またはWebhook経由で任意のシステムにプッシュ
- スキャンを特定のディレクトリに制限したり、スケジュール実行が可能
重要な設計上の決定
注目すべきアーキテクチャ:すべての発見結果は、提示される前に敵対的自己検証ステップを経ます。単なる「AIによるバグ発見」ではなく、「AIが報告前に自分自身と議論する」というものです。これにより、従来のスキャナーと比較してシグナル対ノイズ比が大幅に向上します。
人間の制御は維持
すべてのパッチは、マージ前にレビューと承認が必要です。Claude Securityは、Anthropicが自身のコードベースを保護するために使用しているのと同じモデルに基づいています。これは、社内の信頼の正直なシグナルです。
利用可能性
現在はエンタープライズ限定。TeamおよびMaxプランは後日提供予定です。これは初期段階であり、重要なシステムに対するAI生成パッチは慎重なレビューが必要ですが、方向性(結果を提示する前に自身の推論を検証するAI)はセキュリティツールとして正しいものです。
📖 ソース全文を読む: r/ClaudeAI
👀 See Also

マーキュリー2:リアルタイムAIコーディングのための拡散ベースモデル
Mercury 2は、逐次的ではなく拡散ベースの生成を使用し、トークンを並列に生成して複数のステップで洗練させます。NVIDIA Blackwell GPU上で1,009トークン/秒を達成し、価格は入力トークン100万あたり0.25ドル、出力トークン100万あたり0.75ドルと主張しています。

マイクロソフトのBitNet、単一CPUで1000億パラメーターのLLM推論を実現
マイクロソフトのオープンソースBitNetプロジェクトは、単一CPU上で100BパラメータのLLM推論を5-7トークン/秒で実現し、2Bパラメータモデルは0.4GBメモリ使用量と29msのレイテンシで、ベンチマークにおいて完全精度モデルと同等の性能を発揮します。

DeepSeek有料APIがプロンプトをトレーニングに使用 — OpenClawユーザーが知っておくべきこと
DeepSeekの公式APIは、有料ティアであってもプロンプトをトレーニングに使用します。Geminiは無料のAI Studioでのみログを記録します。OpenClawは現在デフォルトでDeepSeek V4 Flashを使用しています。個人データを処理する際は注意してください。

NvidiaがOpenClawに対抗するため、オープンソースのNemoClawを開発中との報道があります。
最近の報道によると、NvidiaはOpenClawと直接競合するオープンソースプロジェクト「NemoClaw」に取り組んでいるとされています。このプロジェクトは、現代のAIワークフローとの互換性を維持しながら、パフォーマンス、スケーラビリティ、開発者の柔軟性の向上に焦点を当てることが期待されています。