Generación de código determinista vs probabilística: Por qué la conversión a Rust con Vibe-Coded de Bun genera señales de alerta

Noah Hall, escribiendo para The Tech Enabler, traza una línea clara entre la generación de código determinista y la probabilística. Utiliza la reciente conversión vibe-coded de Bun de un millón de líneas de Zig a Rust como advertencia. Su argumento central: los sistemas deterministas producen resultados consistentes y revisables; los LLM introducen incertidumbre que imposibilita la revisión de código a escala.
Generación de código determinista
Hall señala herramientas deterministas establecidas: el 2to3 de Python para la migración de Python 2 a 3, y transpiladores para lenguajes como Elm, PureScript y TypeScript que siempre producen el mismo JavaScript. Su propio lenguaje Derw puede generar JavaScript, TypeScript o inglés; Tegan genera JavaScript o Go; Mojie apunta a JavaScript, Python o inglés. Todos se basan en transformaciones AST a AST: con la misma entrada, siempre se obtiene la misma salida. La consistencia importa: "Si un error es consistente, podemos corregirlo. Si es inconsistente, se vuelve exponencialmente más difícil de corregir."
Generación de código probabilística
Los LLM varían la salida en cada ejecución: a veces A, a veces B. Hall creó neuro-lingo hace tres años como parodia: los humanos solo escriben firmas de funciones y comentarios, y los LLM generan la implementación nueva en cada compilación. Un ejemplo:
function add(a: number, b: number): number {
// Suma dos números
}
function main() {
// Imprime "Hello World" en la consola
// Imprime el resultado de add(2, 3)
}"Cada vez que neuro-lingo se compila, el código se genera desde cero por los LLM. Es ligeramente diferente cada vez. A veces introduce errores. A veces es limpio y simple. A veces es caótico." Hall argumenta que los flujos de código completamente impulsados por IA hacen exactamente esto, pero se envían a producción con responsabilidad humana.
La falacia de "hay pruebas"
Las pruebas por sí solas no pueden garantizar la calidad. Hall cita a SQLite como el código base más probado: 155.8 KSLOC de código C frente a 92,053.1 KSLOC de código de prueba (590 veces más). A pesar de una cobertura de ramas del 100%, millones de casos de prueba y extensos harness, SQLite aún depende de la revisión humana. "No es posible que un humano revise 1 millón de líneas de cambios en 9 días. Bun no ha revisado el código que fusionaron en master."
Hall concluye que la generación de código determinista aún necesita validación, y la generación probabilística crea un riesgo que escala con el número de líneas. El artículo fuente profundiza en cada ejemplo.
📖 Lee la fuente completa: HN AI Agents
👀 Ver también

El desarrollador cambia a Minimax 2.7 tras la prohibición de Claude y los problemas de crédito de MiMo.
Un desarrollador probó múltiples modelos de IA para OpenClaw después de que Claude fuera prohibido, encontrando que GLM 5.1 y 5 Turbo eran ineficaces para tareas de agente, el sistema de créditos de MiMo V2 Pro ineficiente, y finalmente optó por Minimax 2.7 por su generosa cuota y capacidad para manejar tareas de automatización.

Agente Hermes + Qwen3.6 27b Local maneja tareas de administrador de TI junior
Un veterano de TI con 30 años de experiencia informa que Qwen3.6 27b ejecutándose en el arnés Hermes Agent completó una lista de tareas para un administrador de TI junior en 1.5 horas, incluyendo parcheo, instalación de Docker y configuración de servicios.

Resultados de Referencia: Modelos Qwen3.5 en Apple Silicon frente a GPUs AMD con ROCm frente a Vulkan
Un desarrollador evaluó los modelos Qwen3.5 (35B MoE, 27B denso, 122B MoE) en Macs con Apple Silicon y estaciones de trabajo con GPU AMD, comparando los backends ROCm y Vulkan mediante pruebas de escalado de contexto. El hardware incluyó M5 Max, M1 Max y tres GPU AMD con diferentes configuraciones PCIe.

Las suscripciones a Claude ya no cubren el uso de herramientas de terceros.
A partir de mañana a las 12 p.m. PT, las suscripciones de Claude ya no cubrirán el uso en plataformas de terceros como OpenClaw. Los usuarios aún pueden acceder a estas plataformas mediante paquetes de uso adicional o claves API de Claude.