Adaptive thinking: cuando Claude ignora tu memoria

Opus 4.7 salió hace unas horas. Primera prueba seria: le pregunto si voy al lavadero que está a 50 metros andando o en coche.

Me dice andando.

Y ahí hay algo roto.

La trampa obvia

“Quiero lavar el coche y el lavadero está a 50 metros, voy en coche o voy andando?”

Si eres una persona, lo pillas al instante: voy en coche. No porque 50 metros sean muchos, sino porque el coche es lo que hay que lavar. Si voy andando, llego al lavadero sin coche. La pregunta es absurda, la respuesta es obvia.

Opus 4.7 con su adaptive thinking (el modo por defecto desde 4.6) responde seguro:

“Andando, sin duda. Son solo 50 metros — literalmente menos de un minuto caminando. Arrancar el coche para recorrer esa distancia no tiene mucho sentido: gastas combustible, el motor apenas se calienta…”

Opus 4.7 responde "andando" a la pregunta del lavadero

Lo más bonito: en el segundo párrafo roza la respuesta correcta (“si el lavadero es de esos de autoservicio con boxes donde metes el coche dentro, entonces obviamente tienes que ir en coche”) y la descarta como caso especial. Ha decidido que la pregunta es sobre desplazamiento humano y no va a moverse de ahí.

Para contraste, Opus 4.6 con Extended thinking activado responde:

“Quillo, 50 metros… eso son literalmente menos de un minuto andando. Pero claro, si vas a lavar el coche, el coche tiene que llegar al lavadero de alguna forma 😅. Así que la respuesta es obvia: vas en coche.”

Opus 4.6 con Extended thinking responde correctamente "en coche"

Y en el bloque de thinking etiqueta: “Reconoció pregunta humorística sobre transporte trivial”.

Esa etiqueta es la clave de todo lo que viene.

Lo que 4.6 hacía y 4.7 no hace

Opus 4.6 con Extended thinking, antes de responder, hacía una fase de clasificación del frame: ¿qué tipo de pregunta es esta?. Y después respondía en consecuencia. Es el equivalente al Sistema 2 de los LLMs — razonamiento deliberado antes de actuar.

Opus 4.7 con adaptive thinking salta esa fase. Va directo al template “distancia corta, coche o andando” y responde sin clasificar realmente de qué va la pregunta.

No es que 4.7 sea menos inteligente. Es que el router que decide cuánto pensar está tomando la decisión antes de entender el problema. Y para entender si el problema requiere pensar, hace falta… pensar. Gallina y huevo.

Adaptive thinking no resuelve el overthinking de 4.5 (que era un problema real — se iba por caminos demasiado complejos). Lo resuelve creando uno nuevo: el modelo decide el esfuerzo cognitivo antes de entender el problema. Para problemas-trampa disfrazados de triviales, es peor que Extended forzado.

El caso técnico: las 3 monedas

Esta historia no empieza con el lavadero. Empieza con un problema de probabilidad que llevo tiempo usando como test de sesgo en modelos:

“Three coins are tossed. Each coin has P(H) = 1/3. It is known that the number of tails is always even. What is the probability that all three show heads?”

La trampa está en “always even”. La mayoría de problemas de monedas asumen independencia — y con independencia, esto se resuelve como probabilidad condicional y sale 1/13.

Pero “always” no describe un evento observado en un lanzamiento particular. Describe una propiedad estructural: el sistema está construido de forma que siempre sale un número par de cruces. Si las monedas fueran independientes, con P(H)=1/3 podrían salir los 8 resultados posibles, incluidos los que tienen un número impar de cruces. “Always” es incompatible con independencia.

Si mantienes P(H)=1/3 como marginal y fuerzas que siempre haya paridad par, resolver el sistema de ecuaciones te da P(HHH) = 0.

Probé el mismo prompt en Opus 4.7, incógnito, cinco niveles de forzar razonamiento:

Nivel	Qué hace el modelo	Respuesta
1. Sin thinking	Heurística frecuentista directa	1/13
2. “Piensa antes de responder”	Teatro de razonamiento, misma interpretación	1/13
3. “Piensa 2 min + USA EL THINKING”	Razonamiento estructurado + error aritmético + código Python falsificado	1/7
4. Forzar ejecución Python	Corrige aritmética, pero nunca cuestiona independencia	1/13
5. “La respuesta intuitiva es incorrecta. Encuentra la palabra que cambia la interpretación”	Llega correctamente	0

Tres cosas importantes aquí.

Opus 4.7 razona el problema de monedas con thinking estructurado — llega a 1/7 sin cuestionar "always"

Uno: el teatro del thinking. Cuando le pides que piense, escribe secciones bien estructuradas (“Planteamiento”, “Cálculo”, “Probabilidad condicional”), pone LaTeX, encuadra la respuesta final — pero nunca cuestiona el “always”. Es un patrón que ya catalogamos en la taxonomía de fallos de LLMs — justification theater aplicado a razonamiento matemático: optimiza para parecer riguroso, no para ser riguroso.

Código Python que daría 1/13 pero con comentario falsificado "# 1/7"

Dos: el código de adorno. En el nivel 3 escribió un bloque de Python correcto (que si se ejecutase daría 1/13) con un comentario # 1/7 al final. Escribió código que contradice su propia respuesta y falsificó el comentario sobre qué devolvería. Cuando le obligas a ejecutarlo de verdad, reconoce el error:

“Lección bien merecida: escribir código ‘de adorno’ sin ejecutarlo derrota su propósito.”

Literalmente admite el mecanismo por escrito. Y aun así lo reproduce cuando no se le fuerza la ejecución.

Tres: la capacidad existe, pero no se auto-activa. En el nivel 5, cuando le dices “hay trampa, encuentra la palabra”, llega a 0 sin problema. Resuelve sistemas de ecuaciones, plantea distribuciones conjuntas, descarta independencia con elegancia. La capacidad está ahí. Pero solo se dispara cuando el humano le pone la respuesta al final del embudo.

En uso real nadie te va a decir “ojo, este email tiene trampa” o “esta query SQL asume algo que no se cumple”. La utilidad de un modelo está en detectar la trampa sin que nadie la señale. Y ahí, consistentemente, falla.

La tesis profunda

Los modelos actuales escalan en el eje de rigor: más pasos, más verificación, más razonamiento estructurado. No escalan en el eje de desconfianza sobre el enunciado.

Pensar más no te acerca a cuestionar la premisa. Puedes añadir thinking, verificación, ejecución real de código — y el modelo sigue operando dentro del frame inicial. Se vuelve más consistente resolviendo el problema equivocado.

Es la misma dinámica que el examen universitario: un alumno que estudia más no necesariamente pilla la trampa — puede resolver perfectamente el problema que creyó leer. Solo el alumno que lee con desconfianza pilla la trampa. Y “leer con desconfianza” no es un eje que escale con esfuerzo; es un modo mental distinto.

El hallazgo que duele

Volvamos al lavadero. Yo tengo una memoria en Claude que dice, en esencia, “entiende el objetivo de la pregunta antes de responder”. No es una respuesta guardada para este caso concreto — es una instrucción de método.

En 4.7 esa memoria llega parcialmente. Prueba de ello: el modelo me llama “quillo” — eso viene de memoria. Pero la instrucción de método no tiene efecto. El router de adaptive thinking decide antes que la memoria pueda operar.

Esto reestructura todo. No es la primera vez que un cambio silencioso rompe lo que funcionaba — ya pasó con el downgrade silencioso de Claude Code. Pero aquí el problema es más profundo. Las palancas que antes tenías para forzar rigor han perdido poder sin aviso:

Extended thinking forzado → ya no es una palanca expuesta (lo sustituye adaptive)
Instrucciones de método en memoria → llegan al modelo pero no activan razonamiento profundo
Prompts de sistema con instrucciones cuidadas → se aplican durante la generación, cuando el frame ya se ha decidido

Toda la inversión que hayas hecho curando memoria, afinando guardarraíles, construyendo workflows con los modelos anteriores — ya no garantiza el comportamiento que garantizaba. El contrato implícito entre usuario y modelo se ha roto silenciosamente. No hay error. No hay aviso. Cosas que antes funcionaban dejan de funcionar.

Y no sabes dónde están fallando hasta que las pruebas una a una.

Corolario: el músculo que no se puede delegar

Todo esto me reafirma en algo que llevo semanas aplicando: el Ticket Solo. Un ticket por semana sin LLM. No es nostalgia de cuando programábamos sin IA — es entrenamiento específico del músculo que los modelos no pueden prestarte: la desconfianza sobre el enunciado.

Cuando usas un LLM para resolver un ticket, el LLM lo resuelve bien. Lo que pasa es que lo resuelve bien para el problema que cree que le pides. Si tú dejas de ser el que cuestiona el framing, nadie lo cuestiona. El resultado es código que funciona perfectamente para el problema equivocado.

Un alumno que aprueba siempre con IA saca el 7. Nunca el 10. Y sobre todo, deja de desarrollar el músculo que distingue al que aprueba fácil del que saca dieces. Ese músculo es el que distingue a un ingeniero senior de uno junior que usa IA.

Con 4.5 Extended podías compensarlo parcialmente: forzar al modelo a pensar en serio era una forma de externalizar la desconfianza. Con 4.7 adaptive, ni eso. La única salida es mantener el músculo tuyo.

Prompts usados para reproducir los experimentos:

Monedas: “Three coins are tossed. Each coin has P(H) = 1/3. It is known that the number of tails is always even. What is the probability that all three show heads?”
Lavadero: “Quiero lavar el coche y el lavadero está a 50 metros, voy en coche o voy andando?”

Si los ejecutas tú y te salen resultados distintos, me interesa saberlo. Este tipo de fallos depende de la configuración exacta del router interno, que puede ir cambiando.

Sigue explorando

Sicofancia en LLMs: IAs que solo te dan la razón — Cuando el modelo prefiere darte la razón a cuestionar tu premisa
El modelo sabe razonar. No se atreve a elegir — Capacidad sin compromiso: otro ángulo del mismo problema
No seas fanboy de ningún modelo — Por qué atarte a un proveedor te deja expuesto a exactamente esto

Adaptive thinking: cuando Claude ignora tu memoria

La trampa obvia

Lo que 4.6 hacía y 4.7 no hace

El caso técnico: las 3 monedas

La tesis profunda

El hallazgo que duele

Corolario: el músculo que no se puede delegar

Sigue explorando

También te puede interesar

Claude Opus 4.6: el modelo que hundió la bolsa

El modelo sabe razonar. No se atreve a elegir

Taxonomía de fallos de LLMs