Los datos de HN confirman que la proporción de artículos de arXiv está disminuyendo, ¿ya pasó el pico de expectativas sobre los LLM?

Dylan Castillo quería confirmar si estaba viendo menos artículos de arXiv en las portadas de Hacker News, así que usó Claude para realizar un análisis rápido contra el conjunto de datos de BigQuery de HN. Los resultados muestran una tendencia clara: la proporción de historias de arXiv en HN ha estado disminuyendo notablemente en los últimos meses.
También analizó los picos históricos. El primer pico en 2019 fue impulsado por artículos de aprendizaje profundo: el 41% de las 100 publicaciones de arXiv más votadas ese año trataban sobre aprendizaje profundo. El período 2023–2026 tuvo un enfoque aún más fuerte en IA: el 59% de las 100 historias de arXiv más votadas eran sobre LLM o IA. En 2019, los artículos destacados incluyeron MuZero (161 pts), EfficientNet (119 pts), XLNet (79 pts), el artículo de PyTorch para NeurIPS (113 pts) y "On the Measure of Intelligence" de Chollet (80 pts).
Para el período 2023–2026, Castillo pidió a Claude que adivinara qué artículos envejecerán bien. Las selecciones: DeepSeek-R1 (1,351 pts, receta abierta para razonamiento estilo o1 mediante RL), Generative Agents (391 pts, el artículo de "Smallville"), The Era of 1-bit LLMs / BitNet b1.58 (1,040 pts), Differential Transformer (562 pts) y el grupo LK-99 (2,408 + 1,690 pts combinados, un hito en la replicación de ciencia abierta). El análisis completo incluye gráficos de distribución de temas y la evolución de la proporción de arXiv a lo largo del tiempo.
📖 Leer la fuente completa: HN LLM Tools
👀 Ver también

Los fundadores de Codestrap critican las métricas de codificación con IA y advierten sobre problemas de calidad.
Los fundadores de Codestrap argumentan que las herramientas de codificación con IA se están evaluando incorrectamente con métricas como líneas de código y solicitudes de extracción, mientras que las métricas de calidad muestran problemas como una base de código 3,7 veces más grande que funciona 2000 veces peor en una reescritura de SQLite a Rust.

La Actividad DNS de Anthropic Revela Nuevo Servicio STT, API RC2 e Infraestructura de Túnel
El monitoreo de DNS de los subdominios de Anthropic muestra nuevos registros para un servicio de voz a texto en una plataforma 'Titanium', un candidato a lanzamiento de API 2, infraestructura de túnel y un proxy MCP en etapa de preparación.

Nuevos créditos de suscripción de Claude de Anthropic: SDK de agente y claude -p obtienen un grupo separado con límite a partir del 15 de junio
A partir del 15 de junio, los suscriptores de Claude obtendrán un crédito mensual separado para Agent SDK y el uso de claude -p: $200/mes para Max 20x, $100 para Max 5x, $20 para Pro. El uso se detiene cuando el crédito se agota a menos que se opte por facturación adicional. El uso interactivo de Claude Code y el chat permanecen en el pool de suscripción.

Usuario de Reddit Argumenta que los Desarrolladores Deberían Cambiar de la Codificación Limpia a la Arquitectura de Modelos con Agentes de IA
Una publicación de Reddit argumenta que los desarrolladores que utilizan agentes de codificación con IA como Claude deberían dejar de centrarse en escribir código limpio y convertirse en 'arquitectos de modelos' que orquesten sistemas de IA. El autor comparte técnicas específicas, incluyendo crear 'mapas lógicos' antes de codificar y tratar los prompts como revisiones de diseño.