Investigación Automatizada con Claude Code en Base de Código de Producción: 60 Experimentos, 3 Cambios Conservados

Experimento de Investigación Automática en Base de Código de Producción
Un desarrollador probó el enfoque de investigación automática de Karpathy en un sistema real de producción utilizando Claude Code, ejecutando 60 iteraciones en dos rondas mientras estaba lejos del ordenador. El objetivo era un sistema de búsqueda híbrida construido con Django, pgvector y embeddings de Cohere.
Resultados y Hallazgos Clave
De 60 iteraciones, solo se mantuvieron 3 cambios mientras que 57 fueron revertidos. La mejora general en la puntuación fue marginal (+0,03), pero el conocimiento obtenido fue significativo:
- La coincidencia de títulos como señal de búsqueda resultó ser negativa, demostrado en solo 2 iteraciones
- Los grupos de candidatos más grandes no tuvieron efecto: el problema era la clasificación, no la recuperación
- La ponderación adaptativa construida manualmente realmente funcionó: eliminarla causó regresiones
- Modificar fórmulas de amortiguación de palabras clave apenas movió las puntuaciones
- La ronda 2 dirigida al mensaje de metadatos de Haiku no produjo mejoras porque los pesos de clasificación de la ronda 1 estaban co-optimizados para la salida del mensaje original
- Se descubrió un error de almacenamiento en caché de Redis: las claves estaban en el hash de consulta, no en el hash del mensaje, lo que habría pasado a producción sin ser detectado
Conclusiones Prácticas
La mayor percepción fue que la investigación automática ayuda a mapear dónde está el límite superior, no solo a encontrar mejoras. Tener 60 puntos de datos que dicen "Puedes dejar de ajustar esto" proporciona evidencia concreta en lugar de depender de la intuición. El desarrollador señala que este enfoque ahorró tiempo de experimentación manual en optimizaciones que no habrían dado resultado.
El informe completo está disponible en el enlace del blog, y la habilidad de investigación automática de Claude Code de código abierto está en GitHub. El desarrollador está interesado en que otros prueben esto en bases de código no de aprendizaje automático y en qué métricas están utilizando.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Lecciones Prácticas de la Implementación de Bots RAG en Industrias Reguladas
Un desarrollador comparte lecciones aprendidas con esfuerzo al implementar asistentes de IA potenciados por RAG para el cumplimiento normativo en lugares de trabajo australianos en los sectores de construcción, cuidado de ancianos y operaciones mineras. Las ideas clave incluyen técnicas de expansión de consultas, coincidencia de títulos de documentos, capas de prompts y decisiones de infraestructura.

No programador construye descargador de videos local con Claude AI en una sola tarde
Un usuario sin conocimientos de programación utilizó Claude AI para crear AZ Downloader, un descargador de videos local que funciona en 14/16 plataformas, incluyendo YouTube, TikTok, Instagram y Reddit. La herramienta fue creada en una tarde y ahora está disponible en GitHub.

Reseña de Usuario del Complemento Claude Excel: Experiencia Práctica con Tareas de Hojas de Cálculo
Un propietario de una empresa de construcción reporta resultados positivos usando el complemento de Excel de Claude para actualizar hojas de cálculo de cotizaciones y costos de trabajo, destacando la detección de errores y sugerencias de mejora de la interfaz de usuario.

Proyecto de Código Claude de 34 Días del Desarrollador Senior: Ingeniería Sólida, Puntos Ciegos Críticos
Un ejecutivo tecnológico con más de 35 años de experiencia utilizó Claude Code para construir una canalización de conversión de documentos en 34 días, generando más de 300 commits, 272 pruebas y una arquitectura limpia. El proyecto reveló puntos ciegos críticos en torno a bibliotecas existentes y comentarios de usuarios.