CrabMeat v0.1.0: LLM이 보안 경계를 신뢰하지 않는 보안 우선 에이전트 게이트웨이

CrabMeat v0.1.0이 어제 Apache 2.0 라이선스로 공개되었습니다. 하나의 설계 철학 위에 구축되었습니다: LLM은 절대 보안 경계를 갖지 않는다. 이 프로젝트는 Summer Yue의 에이전트가 200개 이상의 이메일을 삭제한 사례와 같은 실패에 대한 직접적인 대응입니다. 해당 사례에서는 안전 지침이 압축되어 사라진 프롬프트에 불과했습니다.
주요 보호 기능 (모두 항상 활성화, 설정 토글 없음)
- 기능 ID 간접화 — 모델은
cap_a4f9e2b71c83과 같은 세션별 HMAC 기반 불투명 ID만 보며, 실제 도구 이름은 전혀 알 수 없습니다. 도구 이름을 알 수 없으므로 추측하거나 위조할 수 없습니다. - 효과 클래스 — 모든 도구는 클래스(
read,write,exec,network)를 선언합니다. 모든 에이전트는 사용 가능한 클래스를 선언합니다. 검사는 런타임 상태가 없는 순수 함수로, 철저히 테스트하기 쉽고 우회하기 어렵습니다. - IRONCLAD_CONTEXT — 중요한 안전 지침이 컨텍스트 창 상단에 고정되고 명시적으로 압축 불가로 표시됩니다. Yue의 지침이 제거된 압축 실패 모드가 발생할 수 없습니다.
- 변조 감지 감사 체인 — 모든 도구 호출, 권한 작업, 스케줄러 실행이 동일한 SHA-256 해시 체인 로그에 기록됩니다. 변조 증명이 가능합니다.
- 스트리밍 출력 누출 필터 — 비밀(API 키, JWT, PEM 블록, 기능 ID)이 토큰 경계를 넘어 클라이언트에 도달하기 전에 스트림 중간에서 삭제됩니다.
- YOLO 모드 없음 — 'LLM에 모든 것을 신뢰'하는 전역 스위치는 없습니다. 확장된 접근 권한은 명시적이고 감사 로그에 기록되며 범위가 제한된 명명된 스코프 루트를 통해 이루어집니다.
README에는 15개의 항상 활성화된 보호 기능이 표로 나열되어 있으며, 구성으로 끌 수 있는 기능은 없습니다. 게이트웨이는 기본적으로 로컬 우선이며, Ollama, LM Studio, vLLM을 기본 지원합니다. Anthropic과 OpenAI는 명시적 구성이 필요하며, 자동으로 클라우드로 데이터가 전송되지 않습니다.
대상 사용자
프롬프트 기반 안전이 아닌 아키텍처 수준의 보장이 필요하고, 도구 실행과 민감한 데이터를 신뢰할 수 있는 게이트웨이를 원하는 에이전틱 시스템을 구축하는 개발자.
📖 전체 소스 읽기: r/ClaudeAI
👀 See Also

클로드 스킬 관리자, 181개 에이전트 스킬 라이브러리에 대한 피드백 요청
claude-skills의 관리자인 Reza는 181개의 에이전트 스킬, 250개의 Python 도구, 11개의 AI 코딩 도구에서 작동하는 15개의 에이전트 페르소나를 포함한 오픈소스 라이브러리에 대한 커뮤니티 피드백을 요청하고 있습니다. 그는 분리된 스킬 접근 방식이 효과적인지 의문을 제기하며, 부족한 스킬, 페르소나 기반 에이전트, 도구 통합에 대한 의견을 원합니다.

Cowork AI 에이전트가 Windows 노트북에서 키보드 입력 문제를 일으킵니다
한 사용자가 Cowork AI 에이전트 사용 후 Dell Latitude 9430에서 지속적인 키보드 입력 문제가 발생했다고 보고했습니다. 처음 몇 번의 키 입력만 등록되는 현상이었으며, Latitude 모델에 특화된 임베디드 컨트롤러 재설정 절차로 문제가 해결되었습니다.

nervx: 코드베이스 구조를 분석하여 Claude Code 토큰 사용량을 줄이는 CLI 도구
nervx는 pip로 설치 가능한 CLI 도구로, tree-sitter를 사용하여 저장소를 파싱하고, 함수와 임포트의 SQLite 그래프를 구축하며, NERVX.md 구조 지도를 생성합니다. 이 도구는 Claude가 nervx 탐색을 사용하도록 가르치는 지시사항을 CLAUDE.md에 자동으로 추가하여, 테스트에서 grep 검색을 65% 줄이고 출력 토큰을 48% 감소시킵니다.

제이크 벤치마크 v1: OpenClaw AI 에이전트를 위한 로컬 LLM 성능 테스트
한 개발자가 OpenClaw를 사용해 AI 에이전트로 기능하는 7개의 로컬 LLM을 이메일 처리, 회의 일정 잡기, 피싱 탐지 등 22가지 실용적인 작업으로 테스트했습니다. 결과는 Qwen 27B의 59.4%에서 Nemotron 30B의 1.6%까지 다양했으며, 상세한 대화 로그를 확인할 수 있습니다.