GoModel: Go로 작성된 경량 오픈소스 AI 게이트웨이

GoModel는 Go로 작성된 오픈소스 AI 게이트웨이로, 애플리케이션과 OpenAI, Anthropic, Gemini 등의 모델 제공업체 사이에 위치합니다. 내부적으로 제공업체별 차이를 처리하면서 통합된 OpenAI 호환 API 인터페이스를 제공합니다.
주요 기능과 차이점
이 프로젝트는 여러 실용적인 문제를 해결하기 위해 만들어졌습니다: 클라이언트나 팀별 AI 사용량과 비용 추적, 애플리케이션 코드 변경 없이 모델 전환, 요청 흐름 디버깅 용이성, 정확 및 의미론적 캐싱으로 AI 지출 절감 등입니다.
대안과의 주요 차별점:
- ~17MB Docker 이미지 (LiteLLM 이미지는 amd64에서 ~746MB로, GoModel가 44배 더 가벼움)
- 요청 워크플로가 가시적이고 검사하기 쉬움
- 기본적으로 환경 변수 우선 구성
빠른 시작
Docker를 이용한 기본 배포:
docker run --rm -p 8080:8080 \
-e OPENAI_API_KEY="your-openai-key" \
enterpilot/gomodel
프로덕션 환경에서는 명령줄을 통해 비밀번호를 전달하지 말고 다음을 사용하세요:
docker run --env-file .env enterpilot/gomodel
첫 API 호출하기:
curl http://localhost:8080/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{ "model": "gpt-5-chat-latest", "messages": [{"role": "user", "content": "Hello!"}] }'
지원되는 제공업체
GoModel는 제공된 자격 증명을 기반으로 자동 감지되는 여러 LLM 제공업체를 지원합니다:
- OpenAI (OPENAI_API_KEY)
- Anthropic (ANTHROPIC_API_KEY)
- Google Gemini (GEMINI_API_KEY)
- Groq (GROQ_API_KEY)
- OpenRouter (OPENROUTER_API_KEY)
- Z.ai (ZAI_API_KEY)
- xAI/Grok (XAI_API_KEY)
- Azure OpenAI (AZURE_API_KEY + AZURE_BASE_URL)
- Oracle (ORACLE_API_KEY + ORACLE_BASE_URL)
- Ollama (OLLAMA_BASE_URL)
이 게이트웨이는 대부분의 제공업체에서 채팅 완성, 임베딩, 파일 처리, 배치 작업 및 패스스루 기능을 지원합니다. Oracle의 경우 업스트림 /models 엔드포인트를 사용할 수 없을 때 ORACLE_MODELS=openai.gpt-oss-120b,xai.grok-3을 설정해야 할 수 있습니다.
대체 설정 방법
소스에서 실행하거나(Go 1.26.2+ 필요) Redis, PostgreSQL, MongoDB, Adminer를 포함한 인프라 구성 요소에 Docker Compose를 사용할 수도 있습니다.
이러한 유형의 게이트웨이는 여러 AI 모델을 다양한 제공업체에서 관리하는 팀, 비용 추적이 필요한 경우, 또는 코드 변경 없이 제공업체를 전환할 수 있는 유연성을 유지하려는 경우에 특히 유용합니다. 가벼운 Docker 이미지는 리소스가 제한된 환경에 적합합니다.
📖 Read the full source: HN LLM Tools
👀 See Also

llm-use – 다중 LLM 에이전트 워크플로우를 위한 라우팅 및 오케스트레이션 오픈소스 프레임워크
llm-use는 다중 LLM 에이전트 워크플로우를 효율적으로 라우팅하고 조율하도록 설계된 오픈소스 프레임워크로 자동화 분야를 혁신하고 있습니다. AI 운영에 미치는 영향을 살펴보세요.

커서의 AI 에이전트를 위한 빠른 정규식 검색 접근법
Cursor는 대규모 모노레포에서 ripgrep이 15초 이상 걸릴 수 있는 성능 문제를 해결하기 위해 색인화된 정규식 검색을 개발 중입니다. 이는 Zobel, Moffat 및 Sacks-Davis의 1993년 연구를 기반으로 한 n-gram을 사용한 역색인을 활용합니다.

KANBAII: Claude Code로 구축된 AI 지원 개발을 위한 시각적 칸반 보드
한 개발자가 Claude Code를 이용해 약 두 달 동안 KANBAII라는 로컬 칸반 보드 도구를 완전히 구축했습니다. 이 도구는 Claude Code 워크플로우를 위한 시각적 작업 관리, AI 계획 수립, 병렬 실행 모드를 제공합니다.

결정 패스포트: AI 에이전트 실행 거버넌스를 위한 감사 계층
클로드 코드 유출 사건은 AI 에이전트 거버넌스의 격차를 드러냅니다. 디시전 패스포트는 이를 위해 추가 전용 실행 기록, 휴대 가능한 증명 번들, 그리고 변조 감지 감사 추적을 위한 오프라인 검증 기능을 제공합니다.