Los LLM generan consultas SQL para analizar terabytes de registros de CI en segundos.

El agente de IA de Mendral rastreó una prueba inestable hasta una actualización de dependencia de tres semanas antes escribiendo sus propias consultas SQL, escaneando cientos de millones de líneas de registro a través de una docena de consultas, y siguiendo un rastro desde los metadatos del trabajo hasta la salida de registro sin procesar. Toda la investigación tomó segundos.
Cada semana, aproximadamente 1.5 mil millones de líneas de registro de CI y 700K trabajos fluyen a través de su sistema. Todo esto se almacena en ClickHouse, comprimido a 35:1. Todo es consultable en milisegundos.
Interfaz SQL para el agente
Exponen una interfaz SQL al agente, limitada a la organización que está investigando. El agente construye sus propias consultas basándose en la pregunta. Sin biblioteca de consultas predefinidas, sin API de herramientas rígida. Una API de herramientas restringida como get_failure_rate(workflow, days) limitaría al agente a preguntas anticipadas. Una interfaz SQL le permite hacer preguntas nunca pensadas, lo cual importa al depurar fallos novedosos.
El agente consulta dos objetivos principales:
- Metadatos del trabajo: una vista materializada con una fila por ejecución de trabajo de CI. El agente usa esto el 63% del tiempo para preguntas como "¿con qué frecuencia falla esto?", "¿cuál es la tasa de éxito?", "¿qué trabajos son los más lentos?", "¿cuándo comenzó a fallar esto?"
- Líneas de registro sin procesar: una fila por línea de registro. El agente usa esto el 37% del tiempo para preguntas como "muéstrame la salida de error para este trabajo", "¿cuándo apareció por primera vez este patrón de registro?", "¿con qué frecuencia ocurre este mensaje de error en diferentes ejecuciones?"
Patrones de consulta y escala
Analizaron 8,534 sesiones del agente y 52,312 consultas de su pipeline de observabilidad. El agente no se detiene en una consulta. Investiga: comienza de manera amplia, luego profundiza.
Total de filas escaneadas en todas las consultas para responder una pregunta:
- Pregunta típica: 335K filas en aproximadamente 3 consultas
- P75: 5.2 millones de filas
- P95: 940 millones de filas
- Las sesiones más pesadas de registro sin procesar escanean 4.3 mil millones de filas
El agente promedia 4.4 consultas por sesión. Una investigación típica comienza con metadatos del trabajo (consultas económicas, mediana de 47K filas) contra una vista materializada compacta y preagregada. Cuando encuentra algo interesante, profundiza en los registros sin procesar (consultas costosas, mediana de 1.1M filas).
Arquitectura de datos
Para que el agente consulte tan rápido, los datos deben estar estructurados para ello. Hasta 300 millones de líneas de registro fluyen en un día ocupado. Usan ClickHouse.
Cada línea de registro lleva 48 columnas de metadatos: el contexto completo de la ejecución de CI a la que pertenece. SHA del commit, autor, rama, título del PR, nombre del flujo de trabajo, nombre del trabajo, nombre del paso, información del ejecutor, marcas de tiempo y más.
En el formato columnar de ClickHouse, desnormalizar 48 columnas en cada línea de registro es esencialmente gratuito. Una columna como commit_message tiene el mismo valor para cada línea de registro en una ejecución de CI, y una sola ejecución puede producir miles de líneas de registro. ClickHouse almacena esos miles de valores idénticos en secuencia. El algoritmo de compresión ve la repetición y la comprime a casi nada.
Ratios de compresión:
commit_message: 301:1display_title: 160:1workflow_path: 79:1step_name: 52:1job_name: 48:1
Sin desnormalización, cada consulta requeriría una unión. Con ella, todas son filtros simples.
📖 Read the full source: HN LLM Tools
👀 Ver también

De Copiar y Pegar a la Integración en el Espacio de Trabajo: La Experiencia de un Desarrollador con la Evolución de la Codificación con IA
Un desarrollador describe la transición desde los primeros intentos de codificación con ChatGPT, que incluían bibliotecas alucinadas y problemas de gestión de contexto, hasta la integración del espacio de trabajo de Claude Code, que lee archivos directamente, eliminando la necesidad de reconstruir el contexto manualmente.

Equipos de Agentes de Código Claude Construyen Productos Micro SaaS en 4 Horas Usando Bóvedas de Obsidian
Un desarrollador construyó un sistema integral donde equipos de agentes Claude Code manejan el ciclo de vida completo de SaaS, desde el descubrimiento de ideas hasta la implementación en 4 horas. El sistema utiliza una bóveda Obsidian como memoria persistente y equipos de agentes especializados para investigación, validación, desarrollo y distribución.

Suspensión y Restauración de Cuentas de Google para Uso de Agentes de IA
Un desarrollador creó una nueva cuenta de Gmail para su agente de IA, que Google suspendió en menos de 20 minutos. Después de enviar una solicitud de restauración detallada explicando el propósito del agente y las medidas de seguridad, Google restauró el acceso en menos de 12 horas.

Los usuarios informan que utilizan Claude Cowork para la preparación de impuestos con declaraciones complejas por trabajo independiente.
Un usuario de Reddit con experiencia en trabajo autónomo utilizó Claude Cowork para procesar formularios 1099 y estados de pérdidas y ganancias, completando las declaraciones de impuestos en minutos. Desactivaron el intercambio de datos y omitieron los números de seguro social por privacidad.