Cómo Mendral redujo los costos de LLM al actualizar a Opus: Patrón de Triaje, Acceso SQL y Arquitectura de Subagentes

✍️ OpenClawRadar📅 Publicado: 29 de abril de 2026🔗 Source
Cómo Mendral redujo los costos de LLM al actualizar a Opus: Patrón de Triaje, Acceso SQL y Arquitectura de Subagentes
Ad

Mendral publicó recientemente detalles sobre cómo actualizaron a Opus 4.6 para el análisis de fallos de CI mientras reducían los costos generales de LLM en comparación con su configuración anterior con Sonnet 4.0. La clave es una arquitectura que separa la clasificación de la investigación y utiliza subagentes baratos para el trabajo pesado.

Arquitectura: clasificador barato, planificador caro

De aproximadamente 4000 fallos de CI analizados, 3187 eran duplicados: una prueba inestable conocida, un problema de infraestructura o un fallo de red. Despertar un modelo caro para eso es un desperdicio. Pero la deduplicación no es determinista: el mismo trabajo puede fallar por diferentes razones. Su solución es un patrón de clasificador:

  • Un agente Haiku maneja la tarea específica: decidir si un fallo ya está registrado. Utiliza coincidencia exacta y búsqueda semántica (pgvector) contra mensajes de error conocidos. Dos cadenas diferentes como operator does not exist bigint character varying y migration type mismatch on installation_id son la misma causa raíz: la búsqueda semántica lo detecta.
  • Ante la duda, Haiku escala a Opus 4.6. Un falso positivo cuesta poco; un falso negativo pierde un error real.
  • 4 de cada 5 fallos nunca llegan a Opus. Una coincidencia del clasificador cuesta aproximadamente 25 veces menos que una investigación completa.
Ad

Deja que los agentes obtengan contexto, no lo envíes

En lugar de meter registros de más de 200 000 líneas en los prompts, los agentes reciben una interfaz SQL a ClickHouse. Hay una tabla sin procesar (github_logs, una fila por línea de registro) y vistas materializadas con datos preagregados: tasas de fallo por flujo de trabajo, tiempos de trabajo, recuentos de resultados. La mayoría de las investigaciones comienzan con las vistas para reducir el alcance y luego profundizan en los registros sin procesar. Si una consulta devuelve demasiadas filas, el sistema trunca y sugiere una vista más específica. Si los registros aún no se han ingerido, los agentes recurren a la CLI de GitHub.

Los modelos caros planifican, los baratos ejecutan

Opus forma una hipótesis y genera subagentes Haiku limitados a un nivel de profundidad, sin expansión ilimitada. Cada subagente recibe un prompt de Opus: exactamente qué buscar y cómo. Ejemplo de un caso real:

Tres trabajos de CI de Storybook fallaron en el mismo commit, fallando en pnpm install. Opus envió un subagente para obtener los mensajes de error de ese paso. ClickHouse aún no tenía los registros, por lo que el subagente usó la CLI de GitHub y devolvió: gyp ERR! not found: make[email protected] no pudo compilar porque make no estaba en el ejecutor. Opus luego consultó ClickHouse para la tendencia de fallos durante 14 días, encontró el punto de inflexión y escaló. Los prompts de los subagentes son explícitos: "Obtén los registros de CI de esta ejecución. Devuelve los mensajes de error exactos del paso pnpm install, la salida de error completa, especialmente las últimas 50-100 líneas."

Para quién es esto

Equipos que construyen agentes impulsados por LLM para depuración de CI o cualquier tarea donde el tamaño del contexto y el costo sean preocupaciones.

📖 Lee la fuente completa: HN LLM Tools

Ad

👀 Ver también

OpenBridge: Control Remoto Gratuito y de Código Abierto para Claude Code a través de Slack/Discord
Herramientas

OpenBridge: Control Remoto Gratuito y de Código Abierto para Claude Code a través de Slack/Discord

OpenBridge es una herramienta gratuita y de código abierto que te permite controlar Claude Code desde Slack o Discord, organizando proyectos como canales y conversaciones como hilos. Se ejecuta localmente o en un VPS y funciona con suscripciones existentes de Claude Code/Codex sin tarifas adicionales de API.

OpenClawRadar
Corrección de Fuga de Memoria de Claude Code para Homelabs Linux
Herramientas

Corrección de Fuga de Memoria de Claude Code para Homelabs Linux

Un desarrollador descubrió que Claude Code tiene una grave fuga de memoria en glibc malloc que consumió 400GB de RAM y colapsó su homelab Proxmox, luego creó una solución de protección de dos niveles con un shim LD_PRELOAD y un watchdog.

OpenClawRadar
🦀
Herramientas

Claude prototipa una aplicación de análisis inmobiliario en 3 horas usando datos en vivo de Zillow a través de clawhub

Un desarrollador usó Claude con la herramienta zillow-full clawhub para construir una aplicación de análisis de flujo de efectivo de alquileres — obteniendo datos en vivo de la API de Zillow, prototipando la interfaz en torno a respuestas JSON reales, y entregando un prototipo funcional en una tarde.

OpenClawRadar
Equipo de IA OS: Capa de Organización Autónoma para Claude Code
Herramientas

Equipo de IA OS: Capa de Organización Autónoma para Claude Code

AI Team OS es una capa de sistema operativo para Claude Code que crea flujos de trabajo autónomos donde el sistema continúa trabajando sin esperar indicaciones del usuario. Incluye 22 plantillas de agentes especializados, más de 40 herramientas MCP, y funciona completamente dentro de la suscripción de Claude Code sin costos de API externos.

OpenClawRadar