Revisión del Rendimiento del Modelo OpenClaw: Codex 5.3 Lidera, los Modelos GLM Decepcionan

Rankings de Rendimiento de Modelos para OpenClaw
Un desarrollador probó múltiples modelos de IA con OpenClaw y compartió observaciones detalladas de rendimiento. Las pruebas cubrieron los modelos Codex, Google, Sonnet, Gemini, DeepSeek y GLM de Z.ai, centrándose en la experiencia práctica de uso en lugar de benchmarks.
Modelos de Mejor Rendimiento
- Codex 5.3 - Calificado 9/10. El modelo favorito del desarrollador, probablemente ajustado para OpenClaw con funciones mejoradas de agente de chat. Comprende bien la intención del usuario, proporciona el resultado deseado consistentemente y tiene interrupciones y errores mínimos.
- Sonnet 4.6 - Calificado 8/10. Segundo favorito debido a su velocidad y capacidad para resolver problemas. Ofrece una experiencia suficiente cuando Codex 5.3 no está disponible, adecuado para uso diario.
- DeepSeek 3.2 Agent - Calificado 7/10. Claramente personalizado para OpenClaw, se siente como trabajar con un agente nativo. No es tan fuerte en programación como Sonnet, Opus o Codex, pero es una alternativa sólida para uso diario. Se señala que las tarifas de API pueden ser altas para una alternativa china.
Modelos de Nivel Medio
- Google 3.1 Pro (Bajo y Alto) - Calificado 6/10. Probado con autenticación antigravity. Interacción débil con OpenClaw, rendimiento lento, no es convincente para uso constante. Solo se consideraría si Sonnet y Codex no estuvieran disponibles.
Rendimientos Decepcionantes
- GLM 4.7 - Calificado 5/10. Comercializado como alternativa a Sonnet con tarifas de API baratas y cuota 3-4 veces mayor que Codex en cuentas pro. Sin embargo, constantemente se atasca, responde tarde y produce longitud de salida inconsistente incluso en tareas simples como revisar correo. Quemó 1 millón de tokens en una nueva sesión solo para revisar 5 correos.
- GLM 5 - Calificado 5/10. Los benchmarks afirman competir con Opus y Codex 5.3, pero la experiencia en OpenClaw no coincide. Usa 2-3 veces más tokens para las mismas tareas, responde tarde y proporciona respuestas de programación a nivel de Sonnet 4.5. Necesita optimización específica para OpenClaw. Su principal ventaja es el precio.
- Gemini 3 Flash - Calificado 4/10. Solo adecuado para tareas muy simples, no recomendado para uso serio.
El desarrollador señaló que elegir el modelo correcto es difícil debido a diferencias obvias en la experiencia, posiblemente porque OpenClaw no está optimizado o hay problemas de calidad del modelo. Expresó decepción con los modelos GLM a pesar de querer diversificar más allá de Codex, esperando correcciones futuras.
📖 Read the full source: r/openclaw
👀 Ver también

Optimizador Gratuito de Sesiones de Claude: Estimador de Tokens, Compresor de Prompts y Planificador de Sesiones
Un desarrollador ha creado una herramienta gratuita sin registro para ayudar a gestionar los límites de uso de Claude con tres funciones: un estimador de tokens para previsualizar el consumo de prompts, un compresor de prompts que reduce los prompts entre un 40-60% eliminando frases de relleno, y un planificador de sesiones que agrupa tareas para minimizar la recarga de contexto.

Skir: Una alternativa moderna a Protocol Buffers para el intercambio de datos con seguridad de tipos.
Skir es un lenguaje declarativo para definir tipos de datos, constantes y APIs que genera código idiomático y con seguridad de tipos en TypeScript, Python, Java, C++, Kotlin y Dart a partir de un único archivo .skir. Incluye seguridad integrada para la evolución de esquemas, soporte RPC similar a gRPC y serialización a formatos JSON o binarios.

Sistema de traducción autoactualizable para OpenClaw mantiene glosarios de dominio automáticamente.
Un script de Python envuelve la API de Kimi2.5 para traducir archivos .srt de subtítulos mientras preserva los índices de bloque, las marcas de tiempo y la segmentación. El sistema utiliza perfiles de proyecto con archivos glossary.json, style.md y memory.jsonl, e incluye un trabajo cron que escanea fuentes oficiales cada 6 horas para actualizar la terminología.

git-prism v0.9.0: Proporciona Diffs Estructurados a Agentes de Codificación de IA mediante MCP
git-prism es un servidor MCP que reemplaza el texto diff de git con JSON estructurado para agentes de IA.