LLM genera consultas SQL para CI en segundos

El agente de IA de Mendral rastreó una prueba inestable hasta una actualización de dependencia de tres semanas antes escribiendo sus propias consultas SQL, escaneando cientos de millones de líneas de registro a través de una docena de consultas, y siguiendo un rastro desde los metadatos del trabajo hasta la salida de registro sin procesar. Toda la investigación tomó segundos.

Cada semana, aproximadamente 1.5 mil millones de líneas de registro de CI y 700K trabajos fluyen a través de su sistema. Todo esto se almacena en ClickHouse, comprimido a 35:1. Todo es consultable en milisegundos.

Interfaz SQL para el agente

Exponen una interfaz SQL al agente, limitada a la organización que está investigando. El agente construye sus propias consultas basándose en la pregunta. Sin biblioteca de consultas predefinidas, sin API de herramientas rígida. Una API de herramientas restringida como get_failure_rate(workflow, days) limitaría al agente a preguntas anticipadas. Una interfaz SQL le permite hacer preguntas nunca pensadas, lo cual importa al depurar fallos novedosos.

El agente consulta dos objetivos principales:

Metadatos del trabajo: una vista materializada con una fila por ejecución de trabajo de CI. El agente usa esto el 63% del tiempo para preguntas como "¿con qué frecuencia falla esto?", "¿cuál es la tasa de éxito?", "¿qué trabajos son los más lentos?", "¿cuándo comenzó a fallar esto?"
Líneas de registro sin procesar: una fila por línea de registro. El agente usa esto el 37% del tiempo para preguntas como "muéstrame la salida de error para este trabajo", "¿cuándo apareció por primera vez este patrón de registro?", "¿con qué frecuencia ocurre este mensaje de error en diferentes ejecuciones?"

Patrones de consulta y escala

Analizaron 8,534 sesiones del agente y 52,312 consultas de su pipeline de observabilidad. El agente no se detiene en una consulta. Investiga: comienza de manera amplia, luego profundiza.

Total de filas escaneadas en todas las consultas para responder una pregunta:

Pregunta típica: 335K filas en aproximadamente 3 consultas
P75: 5.2 millones de filas
P95: 940 millones de filas
Las sesiones más pesadas de registro sin procesar escanean 4.3 mil millones de filas

El agente promedia 4.4 consultas por sesión. Una investigación típica comienza con metadatos del trabajo (consultas económicas, mediana de 47K filas) contra una vista materializada compacta y preagregada. Cuando encuentra algo interesante, profundiza en los registros sin procesar (consultas costosas, mediana de 1.1M filas).

Arquitectura de datos

Para que el agente consulte tan rápido, los datos deben estar estructurados para ello. Hasta 300 millones de líneas de registro fluyen en un día ocupado. Usan ClickHouse.

Cada línea de registro lleva 48 columnas de metadatos: el contexto completo de la ejecución de CI a la que pertenece. SHA del commit, autor, rama, título del PR, nombre del flujo de trabajo, nombre del trabajo, nombre del paso, información del ejecutor, marcas de tiempo y más.

En el formato columnar de ClickHouse, desnormalizar 48 columnas en cada línea de registro es esencialmente gratuito. Una columna como commit_message tiene el mismo valor para cada línea de registro en una ejecución de CI, y una sola ejecución puede producir miles de líneas de registro. ClickHouse almacena esos miles de valores idénticos en secuencia. El algoritmo de compresión ve la repetición y la comprime a casi nada.

Ratios de compresión:

commit_message: 301:1
display_title: 160:1
workflow_path: 79:1
step_name: 52:1
job_name: 48:1

Sin desnormalización, cada consulta requeriría una unión. Con ella, todas son filtros simples.

📖 Read the full source: HN LLM Tools

Los LLM generan consultas SQL para analizar terabytes de registros de CI en segundos.

Interfaz SQL para el agente

Patrones de consulta y escala

Arquitectura de datos

👀 Ver también

Panel de Finanzas Personales Desarrollado con Claude AI: Autohospedado con Backend de Google Sheets

Arquitectura OpenClaw: Construyendo un Motor de Distribución Persistente Impulsado por IA

Las Reglas del Correcaminos de Chuck Jones como Principios de Diseño de Identidad para Agentes de IA

Usando Claude Code con ha-mcp para automatización de Home Assistant