TypeScript 전환 Holaboss AI 런타임, MCP 포트 충돌 해결

한 레딧 사용자가 Holaboss AI 로컬 에이전트 런타임 저장소를 분석하여 Ollama, llama.cpp, LM Studio와 같은 로컬 LLM 스택을 MCP(Model Context Protocol)와 함께 사용하는 개발자를 위한 두 가지 중요한 엔지니어링 개선 사항을 강조했습니다.

TypeScript 전용 패키징

런타임이 완전히 TypeScript로 이전되었습니다. API 계층, 러너 오케스트레이션, 워크스페이스 MCP 호스팅 및 패키징이 모두 TypeScript로 구현되었습니다. 이는 패키지된 런타임이 더 이상 Python 소스 코드나 Python 종속성을 포함하지 않음을 의미합니다. 로컬/셀프 호스팅 스택의 경우, 이로 인해 번들 크기가 더 작아지고 구성 요소가 줄어들며 언어 간 차이가 감소합니다.

지속적 MCP 포트 관리

런타임이 하드코딩된 MCP 포트 계산 방식을 제거했습니다. 대신, 포트가 이제 SQLite에 UNIQUE(port) 제약 조건과 (workspace_id, app_id)를 키로 하여 유지됩니다. 러너는 부트스트랩 중에 준비된 MCP 서버를 병합합니다. 이 접근 방식은 로컬 사이드카가 재시작 시 안정적이고 충돌 방지 포트로 복귀하도록 보장하여 일반적인 "13100 + 추측" 방식을 대체합니다.

분석에 따르면 로컬 모델이 개선됨에 따라 초점이 모델 품질에서 하네스 품질로 전환되고 있습니다. 패키징, 사이드카 수명 주기, 로컬 서비스 발견 및 런타임 상태가 로컬 에이전트 스택이 실제로 견고하게 느껴지는지 여부를 결정하는 중요한 요소가 됩니다.

저장소는 다음에서 확인할 수 있습니다: https://github.com/holaboss-ai/holaboss-ai

📖 Read the full source: r/LocalLLaMA