Después de 3 meses de pruebas A/B con 160 códigos de prompt de Claude: las conclusiones aburridas

Samarth, creador de clskillshub.com, pasó tres meses probando A/B 160 códigos de prompt de Claude usando un banco de pruebas controlado (mismas baterías de tareas, contextos nuevos, resultados evaluados a ciegas). Los hallazgos clave:
1. La mayoría de los códigos de prompt son placebo
Códigos como ULTRATHINK, GODMODE, ALPHA y UNCENSORED no mostraron ningún cambio medible en razonamiento, longitud o calidad frente a una línea base sin prefijo. La salida verbosa de Claude se confunde con una mejora.
2. Solo ~7 códigos cambian consistentemente el razonamiento
L99(el eliminador de rodeos) — sigue siendo el caballo de batalla, más preciso en Sonnet 4.6/Opus 4.7/skeptic— obliga a cuestionar las premisas; se combina con L99 para revisión de código/blindspots— saca a la luz comprobaciones no consideradas (p. ej., error de ruta sensible a mayúsculas CI vs local)/decompose— desglose difuso de tareasOODA— solo funciona en decisiones bajo presión de tiempo, falla en estrategia abiertaARTIFACTS— está desapareciendo porque las versiones más recientes de Claude estructuran la salida por defecto
3. Apilar 3+ códigos confunde al modelo
A partir de 2026, el modelo honra parcialmente un código e ignora los demás. Limítate a pilas de 2 códigos como máximo. La combinación diaria de Samarth: L99 + /skeptic.
4. Los códigos de prompt se degradan — hay que volver a probarlos
Las actualizaciones del modelo cambian el comportamiento. Los códigos que funcionaban en octubre de 2025 no son el mismo conjunto hoy. Si una fuente dice "probado en 2025" y nunca se actualizó, trátala como histórica.
5. Archivos de habilidades > códigos de prompt para Claude Code
Los archivos de habilidades que se activan automáticamente en ~/.claude/skills/ proporcionan contexto de dominio mediante descripciones YAML sin necesidad de volver a introducir el prompt. Los códigos de prompt fuerzan un modo de razonamiento; los archivos de habilidades dan contexto. Problemas diferentes, soluciones diferentes.
Samarth usó Claude Code para construir el banco de pruebas, el código de clasificación y el frontend, y envía archivos de habilidades para su propia pila. La biblioteca gratuita incluye 100 códigos de prompt, una guía de Claude de 40 páginas y 1,545 archivos de habilidades atribuidos por la comunidad (MIT/Apache, atribución completa): clskillshub.com/prompts, clskillshub.com/guide, clskillshub.com/free. Existen niveles de pago, pero no son necesarios para usar nada de lo anterior.
Para los desarrolladores que usan Claude Code a diario, la conclusión práctica: dejen los códigos de prompt de moda, prueben los suyos propios e inviertan en archivos de habilidades para el contexto.
📖 Lee la fuente completa: r/ClaudeAI
👀 Ver también

Logrando que Claude debata de manera adversarial sin ceder: 5 ajustes de instrucciones que funcionan
Cinco técnicas concretas de ingeniería de prompts para evitar que Claude se muestre evasivo, adulador o inventivo cuando actúa como oponente en un debate, basadas en la creación de sparwithai.com.

Problema de acceso a archivos de Claude Cowork con el modo de transmisión de Google Drive y la solución
Al usar Claude Cowork con Google Drive para Escritorio en modo de transmisión, los archivos pueden fallar al abrirse porque Cowork necesita archivos reales en el disco, no marcadores de posición. La solución implica hacer que carpetas específicas estén disponibles sin conexión y usar formatos de archivo estándar.

Ejecutando MiniMax M2.7 Q8_0 128K en 2x3090 con descarga de CPU: benchmarks y configuración del mundo real
Un usuario ejecuta con éxito MiniMax M2.7 en Q8_0 con 128K de contexto en dos RTX 3090 más RAM DDR4, logrando ~50 tps en procesamiento de prompt y ~10 tps en generación de tokens, y comparte sus flags de llama-server.

Plugin OpenClaw Minimalismo: Las Herramientas Principales Manejan el 95% de las Tareas
Un desarrollador que ejecuta OpenClaw en producción informa que deshabilitar complementos no esenciales y reemplazar los críticos con scripts simples resultó en un inicio 40% más rápido, un uso de memoria 60% menor y cero actualizaciones problemáticas durante cuatro meses.