로컬 AI 에이전트 워크플로우: OpenCode, FastMCP, DeepSeek-r1 활용

r/LocalLLaMA의 한 개발자가 LLM을 '고급 자동완성' 이상으로 활용하기 위해 OpenCode, FastMCP, DeepSeek-r1 모델을 사용한 로컬 에이전트 워크플로우를 구현한 경험을 설명합니다.
결정론적 프롬프트를 위한 AGENTS.md 표준
이 개발자는 AI의 시스템 프롬프트에 엄격한 규칙을 주입하는 결정론적 매뉴얼로 AGENTS.md 파일을 사용합니다. 예를 들어 "Python 3.9를 사용하고, Ruff로 포맷하며, 절대 전역 변수를 사용하지 마세요" 같은 규칙이 포함됩니다. 이 접근법은 처음부터 환각 현상을 제거하는 것을 목표로 합니다.
DeepSeek-r1을 활용한 로컬 하위 에이전트
Claude나 GPT-4o 같은 클라우드 API를 사소한 작업에 사용하는 대신, 무료 deepseek-r1 모델을 Ollama로 설정했습니다. pytest.md 파일에 정의된 테스트용 하위 에이전트 같은 특정 에이전트를 만들었습니다. 주요 설정은 다음과 같습니다:
- 온도는 0.1로 설정
- 도구 제한: "pytest": true 및 "bash": false
이를 통해 AI가 자율적으로 테스트 스위트를 실행하고, 트레이스백을 읽으며, 구문 오류를 수정할 수 있으면서도 rm -rf 같은 잠재적으로 위험한 명령은 차단됩니다.
표준화된 로컬 함수 노출을 위한 FastMCP
FastMCP는 "AI의 'USB-C'"로 묘사됩니다—FastAPI와 유사하지만 AI 에이전트용입니다. 약 5줄의 Python 코드로 로컬 서버를 구동해 (개발 데이터베이스 쿼리 같은) 안전한 로컬 함수를 표준화된 방식으로 노출할 수 있으며, 모든 OpenCode 에이전트가 이를 사용할 수 있습니다.
중요한 구현 팁: MCP 프로토콜이 stdio를 통해 실행되므로 모든 Python 로그를 stderr로 라우팅하세요. 일반 print() 문을 남기면 JSON-RPC 패킷이 손상되고 연결이 끊길 수 있습니다.
이 개발자는 이 전체 아키텍처를 처음부터 코딩하고 로컬 환경을 설정하는 과정을 약 15분 동안 녹화한 비디오가 있다고 언급했습니다.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Pali v0.1: 재현 가능한 벤치마크를 갖춘 LLM용 오픈 소스 메모리 인프라
Pali는 Go로 구축된 단일 바이너리로, 다중 테넌트 API, 하이브리드 검색, 플러그 앤 플레이 확장 기능을 갖춘 LLM용 오픈 소스 메모리 인프라입니다. v0.1 릴리스에는 다양한 구성에 대한 성능 지표를 보여주는 재현 가능한 결과가 포함된 벤치마크 제품군이 포함되어 있습니다.

그래프 컴포즈: 시각적 빌더와 AI가 지원되는 호스팅형 시간 기반 워크플로우
Graph Compose는 Temporal에서 API 워크플로우를 오케스트레이션하는 호스팅 플랫폼으로, React Flow 시각적 빌더, TypeScript SDK, 일반 영어를 그래프로 변환하는 AI 어시스턴트라는 세 가지 빌드 방법을 통해 워크플로우를 JSON 그래프로 정의할 수 있습니다.

Cron 작업과 Claude를 사용한 자가 개선 드림 사이클 구축
한 개발자가 두 개의 cron 작업을 사용해 자율적인 드림 사이클을 구축했습니다: 하나는 오후 10시 30분에 연구와 성찰을 위한 것이고, 다른 하나는 오후 11시에 검토와 계획을 위한 것입니다. 이 시스템은 arXiv, GitHub 트렌딩, Reddit을 스캔하고, 약점을 식별하며, 구체적인 개선안을 제안합니다.

클로드 코드 스킬은 딥마인드 알레테이아와 앤트로픽 하네스 접근법을 결합한 것입니다.
Claude Code 스킬은 Planner→Generator→Evaluator→Reviser 파이프라인을 구현하여 DeepMind의 Aletheia 수학 연구 에이전트와 Anthropic의 다중 에이전트 코딩 아키텍처를 결합합니다. 여기에 '블라인드 사전 분석'을 추가했는데, 평가자가 후보 코드를 보기 전에 올바른 접근 방식에 대해 추론하는 방식입니다.