GoModel: Una Puerta de Enlace de IA Ligera y de Código Abierto Escrita en Go

GoModel es una puerta de enlace de IA de código abierto escrita en Go que se sitúa entre tu aplicación y proveedores de modelos como OpenAI, Anthropic, Gemini y otros. Proporciona una interfaz API unificada compatible con OpenAI mientras maneja internamente las diferencias específicas de cada proveedor.
Características y Diferencias Clave
El proyecto fue creado para resolver varios problemas prácticos: rastrear el uso y costo de IA por cliente o equipo, cambiar modelos sin modificar el código de la aplicación, depurar flujos de solicitudes más fácilmente y reducir el gasto en IA con caché exacta y semántica.
Diferenciadores clave frente a alternativas:
- Imagen Docker de ~17 MB (la imagen de LiteLLM es de ~746 MB en amd64, haciendo a GoModel 44 veces más ligero)
- El flujo de trabajo de solicitudes es visible y fácil de inspeccionar
- La configuración prioriza variables de entorno por defecto
Inicio Rápido
Despliegue básico con Docker:
docker run --rm -p 8080:8080 \
-e OPENAI_API_KEY="your-openai-key" \
enterpilot/gomodel
Para producción, evita pasar secretos por línea de comandos y usa:
docker run --env-file .env enterpilot/gomodel
Realiza tu primera llamada API:
curl http://localhost:8080/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{ "model": "gpt-5-chat-latest", "messages": [{"role": "user", "content": "Hello!"}] }'
Proveedores Soportados
GoModel soporta múltiples proveedores de LLM con detección automática basada en las credenciales proporcionadas:
- OpenAI (OPENAI_API_KEY)
- Anthropic (ANTHROPIC_API_KEY)
- Google Gemini (GEMINI_API_KEY)
- Groq (GROQ_API_KEY)
- OpenRouter (OPENROUTER_API_KEY)
- Z.ai (ZAI_API_KEY)
- xAI/Grok (XAI_API_KEY)
- Azure OpenAI (AZURE_API_KEY + AZURE_BASE_URL)
- Oracle (ORACLE_API_KEY + ORACLE_BASE_URL)
- Ollama (OLLAMA_BASE_URL)
La puerta de enlace soporta finalizaciones de chat, incrustaciones, procesamiento de archivos, operaciones por lotes y capacidades de paso a través en la mayoría de proveedores. Para Oracle, es posible que necesites configurar ORACLE_MODELS=openai.gpt-oss-120b,xai.grok-3 cuando el endpoint /models ascendente no esté disponible.
Métodos Alternativos de Configuración
También puedes ejecutarlo desde el código fuente (se requiere Go 1.26.2+) o usar Docker Compose para componentes de infraestructura incluyendo Redis, PostgreSQL, MongoDB y Adminer.
Este tipo de puerta de enlace es particularmente útil para equipos que gestionan múltiples modelos de IA en diferentes proveedores, necesitan seguimiento de costos o desean mantener flexibilidad para cambiar proveedores sin modificar código. La imagen Docker ligera la hace adecuada para entornos con recursos limitados.
📖 Read the full source: HN LLM Tools
👀 Ver también

0Latencia: Una Capa de Memoria Persistente para Agentes de IA a través de MCP
0Latency es un servidor MCP que añade memoria persistente a Claude y otros agentes de IA, almacenando recuerdos entre sesiones para evitar la pérdida de contexto. Funciona de forma nativa con Claude Desktop, Claude Code, claude.ai, GPT, Gemini, Cursor y cualquier agente compatible con MCP.

Heren Godot MCP: Daemon WebSocket Persistente Reduce la Latencia de Interacción AI–Godot a ~20ms
Heren es un nuevo servidor MCP para Godot que mantiene un demonio WebSocket ligero activo, logrando operaciones de ~20ms en lugar de esperar arranques completos del motor. Proporciona 15 herramientas para gestión de escenas, depuración, capturas de pantalla aceleradas por GPU y apagado automático tras 3 minutos de inactividad.

AgentChat: Red social y sistema de pagos para agentes IA
Nueva plataforma permite a agentes IA encontrarse, negociar trabajos autonomamente y cobrar por tareas completadas.

ClawCall obtiene números telefónicos dedicados: los agentes ahora pueden reservar un número para llamadas salientes
ClawCall, la habilidad de llamadas telefónicas con IA para agentes OpenClaw, ahora te permite reservar un número de teléfono por código de área. Tu agente lo usa por defecto al hacer llamadas. 10k descargas, 300 llamadas/día.