로컬 AI 에이전트 설정: OpenCode, FastMCP, DeepSeek-r1 활용법

r/LocalLLaMA의 한 개발자가 LLM을 '고급 자동완성' 이상으로 활용하기 위해 OpenCode, FastMCP, DeepSeek-r1 모델을 사용한 로컬 에이전트 워크플로우를 구현한 경험을 설명합니다.

결정론적 프롬프트를 위한 AGENTS.md 표준

이 개발자는 AI의 시스템 프롬프트에 엄격한 규칙을 주입하는 결정론적 매뉴얼로 AGENTS.md 파일을 사용합니다. 예를 들어 "Python 3.9를 사용하고, Ruff로 포맷하며, 절대 전역 변수를 사용하지 마세요" 같은 규칙이 포함됩니다. 이 접근법은 처음부터 환각 현상을 제거하는 것을 목표로 합니다.

DeepSeek-r1을 활용한 로컬 하위 에이전트

Claude나 GPT-4o 같은 클라우드 API를 사소한 작업에 사용하는 대신, 무료 deepseek-r1 모델을 Ollama로 설정했습니다. pytest.md 파일에 정의된 테스트용 하위 에이전트 같은 특정 에이전트를 만들었습니다. 주요 설정은 다음과 같습니다:

온도는 0.1로 설정
도구 제한: "pytest": true 및 "bash": false

이를 통해 AI가 자율적으로 테스트 스위트를 실행하고, 트레이스백을 읽으며, 구문 오류를 수정할 수 있으면서도 rm -rf 같은 잠재적으로 위험한 명령은 차단됩니다.

표준화된 로컬 함수 노출을 위한 FastMCP

FastMCP는 "AI의 'USB-C'"로 묘사됩니다—FastAPI와 유사하지만 AI 에이전트용입니다. 약 5줄의 Python 코드로 로컬 서버를 구동해 (개발 데이터베이스 쿼리 같은) 안전한 로컬 함수를 표준화된 방식으로 노출할 수 있으며, 모든 OpenCode 에이전트가 이를 사용할 수 있습니다.

중요한 구현 팁: MCP 프로토콜이 stdio를 통해 실행되므로 모든 Python 로그를 stderr로 라우팅하세요. 일반 print() 문을 남기면 JSON-RPC 패킷이 손상되고 연결이 끊길 수 있습니다.

이 개발자는 이 전체 아키텍처를 처음부터 코딩하고 로컬 환경을 설정하는 과정을 약 15분 동안 녹화한 비디오가 있다고 언급했습니다.

📖 Read the full source: r/LocalLLaMA