Las filtraciones del código fuente de Anthropic revelan funciones no anunciadas de Claude y el modelo interno.

Anthropic, la empresa detrás de Claude, ha experimentado dos filtraciones significativas de código fuente en 2025 que revelan funciones no anunciadas y desarrollos internos. La filtración más reciente expuso aproximadamente 500,000 líneas de código en casi 2,000 archivos, que los desarrolladores rápidamente copiaron y analizaron en GitHub.
Lo que revelaron las filtraciones
El código filtrado contiene varias funciones no anunciadas de Claude:
- KAIROS: Una función que permite a Claude ejecutarse en segundo plano y enviar notificaciones push
- Modo sueño: Permite a Claude "pensar constantemente en segundo plano"
- Modo Encubierto: Permite a Claude hacer "contribuciones discretas a proyectos de código abierto"
- Capibara: Un modelo interno que no era conocido previamente por el público
Cronología y contexto
Esta es la segunda filtración de este tipo en 2025, siendo la primera en febrero. El código estuvo accesible públicamente durante horas antes de ser retirado, tiempo durante el cual los desarrolladores ya habían copiado y analizado el contenido. Las filtraciones ocurren mientras Anthropic supuestamente se prepara para una OPI tan pronto como octubre de 2025.
El incidente plantea preguntas sobre las prácticas de seguridad en una empresa que se posiciona como la "empresa de IA responsable" con la seguridad y la ética como elementos centrales de su marca. El material fuente sugiere que esto representa una brecha entre el mensaje público de las empresas de IA y sus operaciones internas.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Claude vs GPT-4o: Mismo Prompt de Péndulo Doble, Diferentes Convenciones de Coordenadas
Claude y GPT-4o producen simulaciones de péndulo doble visualmente diferentes porque interpretan theta desde verticales opuestas (arriba vs abajo), mientras usan el mismo renderizador. Las matemáticas son correctas en ambos casos, pero el desajuste revela una ambigüedad sutil en la interpretación de la instrucción.

Claude-Code v2.1.79 agrega control remoto, corrige bloqueos de subprocesos y mejora el uso de memoria.
Claude-Code v2.1.79 introduce un comando /remote-control para VSCode para conectar sesiones a claude.ai/code, corrige el bloqueo de claude -p en subprocesos y reduce el uso de memoria al inicio en aproximadamente 18 MB. La versión también agrega un indicador --console para autenticación en Anthropic Console y mejora el manejo de tiempos de espera de la API.

Actualización de APEX MoE Quants: Más de 25 nuevos modelos y el nivel I-Nano lanzados
La cuantización mixta de precisión consciente de MoE de APEX se expande a más de 30 modelos en las familias Qwen, Mistral, Gemma y SSM híbridas, además de un nuevo nivel I-Nano que alcanza tan solo 2.06 bpw en expertos de capas medias.

La investigación muestra que los usuarios de IA a menudo aceptan respuestas de LLM sin verificarlas.
Una investigación de la Universidad de Pensilvania descubrió que los usuarios de IA se involucran en una 'rendición cognitiva', aceptando las respuestas de los LLM con un escrutinio mínimo. En experimentos, los usuarios aceptaron respuestas correctas de la IA el 93% del tiempo y respuestas incorrectas el 80% del tiempo, incluso cuando la IA estaba equivocada la mitad de las veces.