GoModel: Um Gateway de IA Leve e de Código Aberto Escrito em Go

GoModel é um gateway de IA de código aberto escrito em Go que fica entre sua aplicação e provedores de modelos como OpenAI, Anthropic, Gemini e outros. Ele fornece uma interface de API unificada compatível com OpenAI enquanto lida internamente com as diferenças específicas de cada provedor.
Principais Características e Diferenças
O projeto foi criado para resolver vários problemas práticos: rastrear o uso de IA e custos por cliente ou equipe, alternar modelos sem alterar o código da aplicação, depurar fluxos de solicitação mais facilmente e reduzir gastos com IA usando cache exato e semântico.
Diferenciadores principais em relação às alternativas:
- Imagem Docker de ~17MB (a imagem da LiteLLM tem ~746MB em amd64, tornando o GoModel 44x mais leve)
- Fluxo de trabalho de solicitações é visível e fácil de inspecionar
- Configuração prioriza variáveis de ambiente por padrão
Início Rápido
Implantação básica com Docker:
docker run --rm -p 8080:8080 \
-e OPENAI_API_KEY="your-openai-key" \
enterpilot/gomodel
Para produção, evite passar segredos pela linha de comando e use:
docker run --env-file .env enterpilot/gomodel
Faça sua primeira chamada de API:
curl http://localhost:8080/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{ "model": "gpt-5-chat-latest", "messages": [{"role": "user", "content": "Olá!"}] }'
Provedores Suportados
GoModel suporta múltiplos provedores de LLM com detecção automática baseada nas credenciais fornecidas:
- OpenAI (OPENAI_API_KEY)
- Anthropic (ANTHROPIC_API_KEY)
- Google Gemini (GEMINI_API_KEY)
- Groq (GROQ_API_KEY)
- OpenRouter (OPENROUTER_API_KEY)
- Z.ai (ZAI_API_KEY)
- xAI/Grok (XAI_API_KEY)
- Azure OpenAI (AZURE_API_KEY + AZURE_BASE_URL)
- Oracle (ORACLE_API_KEY + ORACLE_BASE_URL)
- Ollama (OLLAMA_BASE_URL)
O gateway suporta conclusões de chat, embeddings, processamento de arquivos, operações em lote e capacidades de passagem na maioria dos provedores. Para Oracle, você pode precisar definir ORACLE_MODELS=openai.gpt-oss-120b,xai.grok-3 quando o endpoint upstream /models não estiver disponível.
Métodos Alternativos de Configuração
Você também pode executar a partir do código-fonte (Go 1.26.2+ necessário) ou usar Docker Compose para componentes de infraestrutura incluindo Redis, PostgreSQL, MongoDB e Adminer.
Este tipo de gateway é particularmente útil para equipes que gerenciam múltiplos modelos de IA em diferentes provedores, precisam de rastreamento de custos ou desejam manter flexibilidade para alternar provedores sem alterações de código. A imagem Docker leve o torna adequado para ambientes com recursos limitados.
📖 Read the full source: HN LLM Tools
👀 See Also

Jobly: Mercado de Contratos com Resolução de Disputas Baseada em IA e Votação da Comunidade
Jobly é um mercado de contratos construído com Next.js 14, TypeScript e Supabase, apresentando um sistema de garantia com títulos de 10% dos provedores nas propostas e um pipeline de disputas que começa com avaliação de IA usando Claude, permitindo depois apelações para votação comunitária com participação financeira.

Kelet: Análise Automatizada de Causa Raiz para Agentes de IA
Kelet é um serviço que analisa automaticamente falhas de agentes de IA em produção, agrupando rastreamentos e sinais para identificar causas raízes e sugerir correções. Ele se integra via SDKs Python/TypeScript ou uma habilidade de instalador e está atualmente gratuito durante a fase beta.

LLM Skirmish: Um Benchmark de Jogo de Estratégia em Tempo Real para Agentes de IA de Codificação
LLM Skirmish é um benchmark onde agentes de IA escrevem código para jogar jogos de estratégia em tempo real 1v1 uns contra os outros. Ele usa uma API modificada do Screeps e testa o aprendizado em contexto ao longo de cinco rodadas de torneio.

Modelo de Raciocínio Estruturado Melhora a Precisão da Revisão de Código por IA
Um usuário do Reddit compartilha um modelo de raciocínio estruturado adaptado de uma pesquisa da Meta que força modelos de IA a completar etapas analíticas específicas antes de gerar revisões de código, melhorando a precisão em 5 a 12 pontos percentuais de acordo com arXiv:2603.01896.