Claude Security 공개 베타: 코드베이스 스캔, 자체 발견 검증, 패치 제안

Anthropic이 방금 엔터프라이즈 고객을 대상으로 Claude Security를 퍼블릭 베타로 출시했습니다. 규칙 기반 패턴 매칭(빠르고 저렴하지만 오탐이 많음) 대신, 보안 연구원처럼 코드를 추론합니다. Git 기록을 읽고, 파일 간 데이터 흐름을 추적하며, 비즈니스 로직을 이해합니다. 목표는 패턴 매처가 구조적으로 찾을 수 없는, 맥락 속에서만 의미가 있는 취약점을 잡아내는 것입니다.
주요 기능
- 메모리 손상, 인젝션 결함, 인증 우회, 복잡한 로직 오류 등 심각도가 높은 이슈 스캔
- 결과를 표시하기 전에 적대적 자체 검증을 통해 내부적으로 확인 — Claude가 자신의 결과에 이의를 제기함
- 각 결과에 대해 구체적인 패치를 제안하며, 코드의 구조와 스타일을 유지함
- Slack, Jira 또는 웹훅을 통해 모든 시스템으로 결과 전송
- 특정 디렉토리로 스캔 범위를 지정하거나 일정에 따라 실행 가능
중요한 설계 결정
눈에 띄는 아키텍처: 모든 결과는 표시되기 전에 적대적 자체 검증 단계를 거칩니다. 단순히 "AI가 버그를 찾는다"가 아니라 "AI가 스스로와 논쟁한 후 보고한다"는 점입니다. 이는 기존 스캐너에 비해 신호 대 잡음비를 크게 개선합니다.
인간의 통제 유지
모든 패치는 병합 전에 검토와 승인이 필요합니다. Claude Security는 Anthropic이 자체 코드베이스를 보호하기 위해 사용하는 것과 동일한 모델로 구축되었습니다. 이는 내부 신뢰도를 보여주는 정직한 신호입니다.
사용 가능 여부
현재 엔터프라이즈 전용입니다. 팀 및 맥스 플랜은 추후 제공됩니다. 이는 초기 단계입니다. 중요 시스템의 AI 생성 패치는 신중한 검토가 필요하지만, 방향성(결과를 표시하기 전에 자체 추론을 검증하는 AI)은 보안 도구에 있어 올바른 방향입니다.
📖 전체 소스 읽기: r/ClaudeAI
👀 See Also

Claude Opus 4.7 오류 증가: 상태 업데이트 및 예상 사항
Claude Opus 4.7가 2026-05-19T15:21Z 기준으로 오류 증가 상태입니다. 진행 상황 및 해결 상태는 status.claude.com에서 확인하세요.

최신 AI 모델 벤치마킹: 극단적 모델의 부상
40개의 새로운 AI 모델에 대한 상세한 벤치마킹 결과, '갓 모드'와 '플래시 모드'가 선두를 달리는 분화된 시장이 드러났습니다. 중간급 모델들은 이제 구식으로 간주되고 있습니다.

OpenClaw API 비용, 5.5시간 만에 275달러 기록, 연간 20만 달러 이상으로 전망
OpenAI의 GPT-5.4 API로 OpenClaw를 테스트하는 개발자가 오전 11시부터 오후 4시 30분 사이에 275달러를 지출했는데, 이 사용률을 연간으로 환산하면 20만 달러를 넘어섭니다.

Qwen3.5-122B on Blackwell SM120: fp8 KV 캐시 손상 문제 및 성능 분석 결과
8x RTX PRO 6000 Blackwell 하드웨어에서 Qwen3.5-122B를 테스트한 결과, fp8_e4m3 KV 캐시가 오류 없이 조용히 손상된 출력을 생성하는 문제가 발견되어 bf16 KV 캐시를 사용해야 합니다. MTP 최적화는 단일 요청 속도를 2.75배 향상시켰지만, DeltaNet 제약으로 인해 다른 최적화는 차단되었습니다.