Correr IA en tu GPU AMD en Windows (sin ZLUDA)

Si tienes una Radeon y has querido tocar IA en serio, conoces el muro: todo el ecosistema vive sobre CUDA, o sea, sobre NVIDIA. Buscas “PyTorch + AMD + Windows” y encuentras tres respuestas: usa Linux, usa ZLUDA (emular CUDA), o paga la nube. La conclusión implícita siempre es la misma — para IA, tu AMD no vale.

Nos negamos a aceptarlo y nos pusimos a ello. Spoiler: se puede, en Windows, nativo, y sin emular nada. Lo contamos sin tutorial — solo la idea y el camino, para que sepas que existe.

Lo que demostramos

Conseguimos correr PyTorch nativo sobre ROCm en una AMD Radeon RX 6800 XT en Windows, y ejecutar modelos de IA reales en local, gratis, sin nube ni APIs.

Para probarlo a fondo elegimos un caso exigente: un modelo de texto a voz con clonación que montara en tiempo real. Funcionó — le dimos voz propia a nuestro asistente, Axon Terminal. Pero lo importante no es la voz: es que una vez tienes PyTorch corriendo en tu AMD, sirve para cualquier modelo — lenguaje, imágenes, transcripción, lo que sea.

El camino (la idea, no el paso a paso)

ROCm nativo, no ZLUDA. Esta es la clave que lo cambia todo. ZLUDA traduce CUDA a AMD: emula, con su sobrecoste, y la app sigue “creyendo” que habla con NVIDIA. Lo que usamos es distinto: PyTorch compilado directamente para ROCm, el stack de cómputo de AMD. La GPU ejecuta en su lenguaje nativo, sin intérprete. La pieza que lo hace posible son las wheels del proyecto TheRock (de la propia AMD), que ya traen builds para tarjetas RDNA2 que el soporte “oficial” de Windows todavía no lista.

Y luego, los muros. Porque los hay, y nadie los cuenta (casi nadie pasa por aquí). Son detalles, pero te frenan en seco si no sabes que existen:

La librería de kernels de AMD (MIOpen) no compilaba por unos headers de C++ que faltaban en el entorno. Estaban ahí (vienen con Visual Studio); solo había que apuntarle dónde mirar.
Todo iba a tirones la primera vez que aparecía cada tarea. No era falta de potencia: MIOpen buscaba exhaustivamente el mejor kernel para cada caso nuevo (decenas de segundos de parón). Una variable de entorno (MIOPEN_FIND_MODE en modo rápido) lo desplomó. De inservible a fluido.
Más la ración habitual de Windows: codificaciones que corrompen acentos, cachés que no persisten entre arranques, procesos huérfanos peleándose por la GPU…

Ninguno insalvable. Todos invisibles hasta que te los topas — y esa es, justamente, la única ventaja real de NVIDIA aquí.

Entonces, ¿qué pierdes con AMD? (la parte honesta)

Esto es lo que esperábamos encontrar y no encontramos: que la AMD fuera más lenta. No lo es. En nuestro caso, la Radeon genera voz al mismo ritmo que una NVIDIA RTX equivalente — medimos tiempos prácticamente idénticos. El cuello de botella nunca fue el silicio de AMD; era el setup. Resueltos los muros de arriba, el rendimiento va a la par.

Lo que NVIDIA te da de más no es velocidad: es comodidad. Con CUDA, instalas y funciona. Con AMD en Windows, tienes que pelearte con lo que contamos aquí. Esa es la diferencia honesta — horas de trasteo, no fotogramas por segundo.

El argumento que nadie pone sobre la mesa: VRAM por euro

Y aquí viene lo que de verdad importa para IA local. El factor que decide qué modelos puedes correr no es la velocidad: es la VRAM. Un modelo entra en la tarjeta o no entra. Y ahí AMD te cobra menos por los mismos gigas:

16 GB en AMD: una RX 9060 XT 16GB ronda los ~530 €.
16 GB en NVIDIA: la RTX 5060 Ti 16GB se va a ~640-700 €. Y aquí el detalle que remata el caso: es de las tarjetas más flojas de su gama — una RTX 5070 rinde un 30-40% más por un precio casi idéntico. En NVIDIA, los 16GB asequibles solo te llegan en una gráfica de entrada: pagas el sobreprecio por la memoria, no por el rendimiento. (Y con la crisis de VRAM de 2026 que infló todo, NVIDIA hasta recortó la producción de esa versión de 16GB.)
¿Segunda mano? Una RX 6800 XT como la nuestra —16 GB— se encuentra por bastante menos que cualquier NVIDIA con esa memoria.

Misma cantidad de VRAM, ~100-170 € menos. La pregunta deja de ser “¿cuánto rinde?” (rinde igual) y pasa a ser “¿cuánto me cuesta meter 16 GB para IA?” — y ahí AMD gana. Para correr modelos en local, esos gigas son los que marcan la diferencia entre cargar el modelo o no.

Por qué importa

El muro nunca fue el hardware — era el software y la falta de un camino documentado. Una vez derribado, tu GPU AMD deja de ser “solo para jugar” y pasa a ser una plataforma de IA local: privada, gratis, sin depender de nadie. Con el mismo rendimiento que la alternativa cara, y con más VRAM por tu dinero.

No hace falta que te cambies a NVIDIA ni que te vayas a la nube para empezar. Hace falta saber que se puede — y ahora lo sabes.

En Neuralflow lo recorrimos para darle voz propia a Axon Terminal, pero el camino vale para cualquiera con una Radeon. Si quieres el cómo a fondo, escríbenos.

Sigue explorando

Correr IA: en tu equipo o en la nube - Cuándo compensa lo local y cuándo no, sin marketing.
Guía de self-hosting - Montar tus propios servicios en casa, paso a paso.
¿Vale la pena pagar por IA? - Lo que de verdad ganas (y pierdes) frente a correrla tú.

Correr IA en tu GPU AMD en Windows (sin ZLUDA)

Lo que demostramos

El camino (la idea, no el paso a paso)

Entonces, ¿qué pierdes con AMD? (la parte honesta)

El argumento que nadie pone sobre la mesa: VRAM por euro

Por qué importa

Sigue explorando

También te puede interesar

Crisis del hardware: tu portátil costará un 20% más

3-5 años para que los agentes de IA sean normales

El 17% de Empresas Vascas Usa IA — y Facturan un 8,7% Más