홀라보스 AI 런타임, 타입스크립트로 전환 및 지속적 MCP 포트 구현

한 레딧 사용자가 Holaboss AI 로컬 에이전트 런타임 저장소를 분석하여 Ollama, llama.cpp, LM Studio와 같은 로컬 LLM 스택을 MCP(Model Context Protocol)와 함께 사용하는 개발자를 위한 두 가지 중요한 엔지니어링 개선 사항을 강조했습니다.
TypeScript 전용 패키징
런타임이 완전히 TypeScript로 이전되었습니다. API 계층, 러너 오케스트레이션, 워크스페이스 MCP 호스팅 및 패키징이 모두 TypeScript로 구현되었습니다. 이는 패키지된 런타임이 더 이상 Python 소스 코드나 Python 종속성을 포함하지 않음을 의미합니다. 로컬/셀프 호스팅 스택의 경우, 이로 인해 번들 크기가 더 작아지고 구성 요소가 줄어들며 언어 간 차이가 감소합니다.
지속적 MCP 포트 관리
런타임이 하드코딩된 MCP 포트 계산 방식을 제거했습니다. 대신, 포트가 이제 SQLite에 UNIQUE(port) 제약 조건과 (workspace_id, app_id)를 키로 하여 유지됩니다. 러너는 부트스트랩 중에 준비된 MCP 서버를 병합합니다. 이 접근 방식은 로컬 사이드카가 재시작 시 안정적이고 충돌 방지 포트로 복귀하도록 보장하여 일반적인 "13100 + 추측" 방식을 대체합니다.
분석에 따르면 로컬 모델이 개선됨에 따라 초점이 모델 품질에서 하네스 품질로 전환되고 있습니다. 패키징, 사이드카 수명 주기, 로컬 서비스 발견 및 런타임 상태가 로컬 에이전트 스택이 실제로 견고하게 느껴지는지 여부를 결정하는 중요한 요소가 됩니다.
저장소는 다음에서 확인할 수 있습니다: https://github.com/holaboss-ai/holaboss-ai
📖 Read the full source: r/LocalLLaMA
👀 See Also

4개 창 iTerm2 설정으로 Claude 코드 CLI의 AI 역할 분리
한 개발자가 컨텍스트 드리프트와 자기 평가 편향을 해결하기 위해 Claude Code CLI를 위한 4개 창 iTerm2 터미널 설정을 구축했습니다. 각 창은 전용 모델과 권한으로 특정 역할에 고정되어 있습니다.

다중 모드 에이전트 지연 시간을 스크린샷 기록 생략으로 줄이기
개발자가 다중 모달 에이전트 요청에서 이전 스크린샷을 생략하고 base64 이미지 데이터를 '[image omitted]' 문자열로 대체하면 성능을 유지하면서 지연 시간을 크게 줄일 수 있다는 사실을 발견했습니다. 이 실험은 Claude를 사용하여 진행되었으며 GitHub에 문서화되었습니다.

MarkView: 오픈소스 도구로 AI 생성 마크다운 파일을 렌더링하고 관리합니다
MarkView는 Mermaid 다이어그램과 KaTeX 수식을 지원하는 Markdown 파일 렌더링 엔진으로, 웹 앱, 네이티브 macOS 앱, Claude Desktop 및 Cursor 통합용 MCP 서버로 이용할 수 있습니다.

ClawTalk iOS 앱, 자체 호스팅 OpenClaw AI 에이전트와 음성 채팅 가능
ClawTalk은 OpenClaw 자체 호스팅 LLM 설정을 위한 푸시-투-톡 음성 채팅을 제공하는 네이티브 iOS 앱입니다. WhisperKit을 사용한 기기 내 음성-텍스트 변환, 마크다운 렌더링이 지원되는 실시간 스트리밍 응답, ElevenLabs, OpenAI, Apple 내장 음성을 포함한 다양한 TTS 옵션을 지원합니다.