Claude Sonnet 4.6: rendimiento flagship, precio medio

TL;DR

Sonnet 4.6 iguala a Opus 4.6 en computer use (72.5% vs 72.7%) y lo supera en tareas de oficina (GDPval-AA Elo: 1633 vs Opus)
Precio: $3/$15 por millón de tokens, frente a $5/$25 de Opus 4.6. Hace un año, ese rendimiento costaba $15/$75 con Opus 4.5
Computer use ha pasado de 14.9% a 72.5% en 16 meses — casi se ha quintuplicado
Ventana de contexto de 1 millón de tokens en beta. Ahora es el modelo por defecto en claude.ai y Claude Code
Si estás pagando por el modelo más caro “por si acaso”, es hora de revisar tu stack

Hace doce días, Anthropic lanzó Opus 4.6 y el mercado perdió $285.000 millones en capitalización bursátil. Ayer, sin que nadie se inmutara, lanzaron algo potencialmente más disruptivo: un modelo que hace casi lo mismo por una fracción del precio.

Claude Sonnet 4.6 no es una actualización incremental. Es la demostración de que la inteligencia artificial frontier ya no necesita ser cara.

Los números que importan

Vamos directo a la comparación:

Benchmark	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified (código)	79.6%	80.8%	~75%
OSWorld (computer use)	72.5%	72.7%	—
GDPval-AA Elo (tareas de oficina)	1633	<1633	—
Precio input/1M tokens	$3	$5	$1.75
Precio output/1M tokens	$15	$25	$14

Lee esa tabla otra vez. En tareas de oficina reales — redactar informes, analizar documentos, organizar información — Sonnet 4.6 supera al modelo que vale un 67% más. En código y computer use, la diferencia con Opus es de menos de dos puntos porcentuales.

La caída del precio de la inteligencia

Para poner esto en perspectiva temporal:

Opus 4.5 (finales 2025): $15 entrada / $75 salida → el precio de referencia frontier
Opus 4.6 (febrero 2026): $5 entrada / $25 salida → una rebaja brutal del 67%
Sonnet 4.6 (febrero 2026): $3 entrada / $15 salida → rendimiento equivalente, 40% menos que Opus 4.6

En menos de tres meses, el coste de la inteligencia frontier se ha reducido un 80%. Pasamos de $75 por millón de tokens de salida a $15 por el mismo nivel de rendimiento. Esto no es una tendencia. Es un desplome.

Y la curva de costes en IA no hace más que acelerarse. Lo que hoy cuesta $15, dentro de seis meses probablemente cueste $5.

Computer Use: de promesa a realidad

El dato que menos titulares genera y más importa: la capacidad de usar un ordenador como un humano.

En octubre de 2024, Claude sacaba un 14.9% en OSWorld. Ayer, Sonnet 4.6 sacó un 72.5%. Eso es casi quintuplicar el rendimiento en 16 meses.

¿Qué significa en la práctica? Que un modelo de $3/$15 puede:

Navegar por aplicaciones web
Rellenar formularios
Hacer clic en botones, escribir en campos
Ejecutar workflows multi-paso en tu pantalla

El agente de IA que maneja tu ordenador ya no es ciencia ficción. Y no necesitas el modelo más caro para hacerlo funcionar.

Un millón de tokens de contexto

Sonnet 4.6 viene con ventana de contexto de 1 millón de tokens en beta. Para hacerte una idea: eso son aproximadamente 750.000 palabras, o unas 3.000 páginas de texto.

Hay letra pequeña: a partir de 200.000 tokens de input, el precio se duplica ($6/$22.50). Pero incluso con ese recargo, sigue siendo más barato que Opus.

Para aplicaciones RAG, análisis de documentos extensos, o code review de repositorios grandes, esto es relevante. Ya no necesitas recurrir a Opus o Gemini solo por el contexto.

Cuándo usar Sonnet 4.6 vs Opus vs Haiku

Aquí va la guía práctica que nadie te va a dar en un press release:

Caso de uso	Modelo recomendado	Por qué
Chatbot, FAQ, clasificación	Haiku 4.5 ($0.50/$3)	No necesitas un cañón para matar moscas
Código, análisis, documentos, agentes	Sonnet 4.6 ($3/$15)	95%+ del rendimiento de Opus por mucho menos
Razonamiento científico extremo, investigación	Opus 4.6 ($5/$25)	Ese 1-2% importa cuando la precisión es crítica
Tareas masivas de bajo valor	Haiku 4.5 + batch ($0.25/$1.50)	50% de descuento en batch API

La regla es simple: empieza con Sonnet 4.6. Solo escala a Opus si demuestras que necesitas ese 1-2% extra de rendimiento. Y baja a Haiku para todo lo que no requiera razonamiento complejo.

Si estás gestionando costes de IA en serio, esta tabla debería ser tu punto de partida.

El patrón que deberías reconocer

Esto ya ha pasado antes:

GPT-4 era el modelo premium. GPT-4o lo igualó por menos. GPT-4.1 mini lo hizo por céntimos.
Opus 4.5 era el flagship. Opus 4.6 lo mejoró por un tercio del precio. Ahora Sonnet 4.6 lo iguala por aún menos.

El flagship de hoy es el mid-tier de mañana. Siempre.

La implicación para empresas: no diseñes tu arquitectura alrededor de un modelo específico. Diseña para poder cambiar de modelo fácilmente. El que hoy te cuesta $15/$75 mañana costará $3/$15, y dentro de un año habrá algo mejor por $1/$5.

Si tu proveedor de IA te ata a un modelo concreto con contratos largos, estás pagando de más. Garantizado.

Sonnet 4.6 como default en Claude Code

Para los que programáis: Sonnet 4.6 es ahora el modelo por defecto en Claude Code. Claude Code ya genera más de $1.000M en ingresos anuales y se ha convertido en la herramienta de desarrollo más adoptada del ecosistema.

Que Anthropic ponga Sonnet como default en vez de Opus dice mucho: confían en que el rendimiento es suficiente para el 95% de los casos de uso. Y prefieren que los desarrolladores usen más (a precio bajo) que poco (a precio alto).

Lo que realmente significa para tu presupuesto

Haz la cuenta. Si tu empresa tiene un chatbot interno con 10.000 interacciones diarias:

Modelo	Coste mensual estimado
Opus 4.5 (anterior)	~€8.000-12.000
Opus 4.6	~€3.000-5.000
Sonnet 4.6	~€2.000-3.500
Haiku 4.5	~€400-800

Para la mayoría de casos de uso empresarial, Sonnet 4.6 es la elección obvia. El rendimiento es prácticamente idéntico al flagship, y el ahorro se nota en la cuenta de resultados.

Si tu empresa aún no ha empezado con FinOps para IA, ahora es el momento. No porque los precios suban, sino porque están bajando tan rápido que podrías estar pagando de más sin saberlo.

Mi opinión

Llevo usando Claude como herramienta principal desde 2024. He pasado por Opus 4.5, Opus 4.6, y ahora Sonnet 4.6. Mi conclusión: para el 90% de mi trabajo — código, análisis, escritura técnica — Sonnet 4.6 es indistinguible de Opus.

¿Dónde noto la diferencia? En tareas de razonamiento encadenado muy largo, donde Opus mantiene mejor la coherencia a lo largo de muchos pasos. Pero esos casos son el 10% del uso real.

La realidad es que el “impuesto premium” de pagar por el modelo más caro se está evaporando. Y eso es bueno para todos — excepto para quien tenía un modelo de negocio basado en vender la versión cara.

Si aún no tienes claro cuál de los grandes LLMs te conviene, la respuesta en 2026 es más matizada que nunca. Pero una cosa está clara: el precio ya no es la barrera.

Sigue explorando

Claude Opus 4.6: El Modelo que Hundió la Bolsa - El hermano mayor que provocó un terremoto bursátil hace dos semanas
FinOps para IA: Cómo No Arruinarte con los Costes de Inferencia - Guía práctica para controlar lo que gastas en LLMs
ChatGPT vs Gemini vs Claude: Comparativa 2026 - Los tres grandes, cara a cara