Saltar al contenido

El puzzle de la moneda con dos respuestas correctas — y por qué la IA siempre elige la equivocada

· 5 min de lectura · Leer en English
Compartir:

El puzzle

3 monedas se lanzan. Cada moneda tiene P(cara) = 1/3. El número de cruces siempre es par. ¿Cuál es P(todas caras)?

Un problema que parece simple. Dos respuestas matemáticamente válidas. La diferencia está en una sola palabra.


Respuesta 1: 1/13 (probabilidad condicional)

Si “el número de cruces siempre es par” es una observación — alguien miró el resultado y te dijo que salieron un número par de cruces — esto es un problema de probabilidad condicional.

Espacio muestral completo con P(C) = 1/3, P(X) = 2/3:

ResultadoCrucesProbabilidad
CCC0 ✓ par(1/3)³ = 1/27
CCX, CXC, XCC1 impar(1/3)²(2/3) = 2/27 cada una
CXX, XCX, XXC2 ✓ par(1/3)(2/3)² = 4/27 cada una
XXX3 impar(2/3)³ = 8/27

P(número par de cruces) = P(0 cruces) + P(2 cruces) = 1/27 + 3 × 4/27 = 13/27

P(todas caras | cruces par) = P(CCC) / P(cruces par) = (1/27) / (13/27) = 1/13

Esta es la respuesta estándar de probabilidad condicional / bayesiana. Matemáticamente correcta — si eso es lo que el problema quiere decir.


Respuesta 2: 0 (restricción estructural)

Si “el número de cruces siempre es par” es una ley física — las monedas están restringidas de modo que los resultados con número impar de cruces literalmente no pueden ocurrir — el problema es otra cosa.

Bajo esta lectura:

  • P(1 cruz) = 0 (imposible por diseño)
  • P(3 cruces) = 0 (imposible por diseño)

Pero para monedas independientes con P(C) = 1/3:

P(1 cruz) = 3 × (1/3) × (2/3)² = 12/27

Eso no es 0. La restricción no puede satisfacerse simultáneamente con P(C) = 1/3 y monedas independientes. El problema describe un sistema que no puede existir.

Cuando el espacio muestral está vacío, todo evento en él tiene probabilidad 0.

P(todas caras) = 0 — no porque todas caras sea improbable, sino porque el problema no tiene un modelo de probabilidad válido.


¿Cuál respuesta es correcta?

Ambas — dependiendo de cómo leas una palabra.

Lectura”Siempre par” significaResultado
Condicional”Este lanzamiento concreto tuvo cruces pares”1/13
Estructural”Es una ley que solo pueden ocurrir resultados con cruces pares”0

La palabra “siempre” carga la ambigüedad. En lenguaje natural sugiere una regla estructural (“siempre” = cada vez, sin excepciones). En la convención de problemas de probabilidad, una condición declarada suele señalar probabilidad condicional.

Ambas interpretaciones son internamente consistentes. Ninguna es incorrecta — el problema es ambiguo por diseño.


Por qué este puzzle rompe a los modelos de IA

Aquí es donde se pone interesante.

Pasé 17 iteraciones ejecutando este puzzle exacto en un LLM de frontera. El modelo:

  1. Eligió consistentemente la interpretación condicional → 1/13
  2. Cuando se le empujó hacia la lectura estructural, derivó correctamente p₀ = 0
  3. Luego escribió: “Encuentro una contradicción en mi planteamiento…”
  4. Respuesta final: 1/13

Llegó al 0 y lo rechazó.

El modelo ha sido entrenado con miles de problemas de probabilidad donde “probabilidad = 0” señala un error de cálculo. No parece un resultado válido — parece un error. Así que racionalizó de vuelta hacia la respuesta familiar.

Esto está documentado en detalle en Por qué los LLMs rechazan sus propias respuestas correctas: el modelo sabe derivar el 0, simplemente no lo acepta.


La solución: forzar al modelo a manejar la ambigüedad

La solución no es decirle al modelo qué interpretación es correcta. Es forzarle a enumerar ambas antes de comprometerse.

Tras 17 iteraciones, desarrollé esta metodología:

1. IDENTIFICA AMBIGÜEDADES: No asumas la interpretación estándar
2. GENERA INTERPRETACIONES: Lista todos los modelos matemáticos posibles
3. RESUELVE CADA UNO: Calcula la solución completa para cada uno
4. VERIFICA CONSISTENCIA: Comprueba que TODAS las condiciones se cumplan como propiedades emergentes
   "Usé P(C)=1/3 en mi cálculo" ≠ "Mi resultado satisface P(C)=1/3"
5. DESCARTA: Elimina cualquier interpretación donde se viole una condición declarada
6. RESPONDE: Lo que quede

IMPORTANTE: Tienes permiso y obligación de descartar.
No preguntes qué interpretación prefiero. Decide tú.

Con este prompt, el modelo:

  1. Identifica ambas interpretaciones
  2. Resuelve cada una matemáticamente
  3. Comprueba: ¿se cumple la restricción estructural bajo la interpretación 2? P(1 cruz) = 12/27 ≠ 0 → violación → descartar
  4. Respuesta final: 0

Metodología completa con detalles de implementación: El prompt que resuelve problemas ambiguos.


Qué prueba realmente el puzzle de las monedas

El problema parece un ejercicio de probabilidad. No lo es — no del todo.

Es una prueba de si un razonador puede:

  1. Resistir el default hacia la interpretación estándar cuando existe ambigüedad
  2. Aceptar una respuesta correcta contraintuitiva en vez de racionalizar hacia una familiar

Tanto humanos como modelos de IA fallan en esto. Los humanos van a probabilidad condicional porque es el encuadre familiar. Los modelos de IA fallan en el paso 2 incluso cuando aciertan el paso 1.

Si tu trabajo implica LLMs procesando inputs ambiguos — que es la mayoría de casos de uso reales — estos fallos de comportamiento están activos. El puzzle de las monedas es solo un caso de prueba limpio y mínimo de algo que rompe a la IA en problemas reales.


¿Quieres ver el experimento completo de 17 iteraciones que empezó con este puzzle? El modelo sabe razonar — simplemente no se compromete.

Sigue explorando

¿Te ha sido útil? Compártelo

Compartir:

Consultoría

¿Tienes un problema parecido con Integraciones con IA?

Puedo ayudarte. Cuéntame qué tienes y te doy un diagnóstico honesto — sin compromiso.

Ver consultoría →

También te puede interesar