4 de julio 2026 - 12:04hs

DeepSeek presentó su modelo V4 el 24 de abril de 2026. La compañía lanzó dos variantes, una es V4-Pro con 1,6 billones de parámetros totales y 49 mil millones activos por token. Otra, es V4-Flash con 284 mil millones totales y 13 mil millones activos. Ambas soportan un millón de tokens de contexto y los pesos quedaron disponibles bajo licencia de MIT en Hugging Face. La prensa estatal celebró el lanzamiento como prueba de paridad tecnológica con Estados Unidos y la cifra impresiona aunque la arquitectura impresiona menos.

El modelo recurre a un sistema híbrido de atención bautizado CSA y HCA. La razón no es la elegancia teórica sino la escasez de silicio. Cuando el cómputo falta, la creatividad arquitectónica florece por necesidad. Los ingenieros chinos descubrieron, como Ulises antes que ellos, que la astucia nace del bloqueo. La eficiencia que hoy presentan como mérito mañana será el síntoma del límite.

La cadencia disimulada

La narrativa oficial sostiene que DeepSeek lanzó un modelo nuevo después de meses de trabajo silencioso. Sin embargo, la cronología verdadera es otra. Entre el modelo R1 de enero de 2025 y el V4 de abril de 2026 hubo seis publicaciones intermedias. Vinieron las versiones V3-0324 en marzo, R1-0528 en mayo, V3.1 en agosto y V3.1-Terminus en septiembre. Luego la V3.2-Exp con atención esparsa en octubre y la V3.2-Speciale en diciembre. La compañía publicaba cada dos meses sin estridencia.

Estas iteraciones revelan una verdad incómoda, DeepSeek no avanza por saltos sino por reescrituras parciales del mismo modelo base. Cada versión optimiza un fragmento pero ninguna inaugura una frontera. La eficiencia se acumula, al tiempo que la capacidad apenas se mueve.

OpenAI publicó GPT-5.5 el 23 de abril y Anthropic lanzó Opus 4.7 días antes. Por su parte, Google sostiene Gemini 3.1 Pro. La diferencia no es de meses sino de doctrina. Los laboratorios estadounidenses iteran sobre arquitecturas que ya tienen pero los chinos iteran sobre arquitecturas que se les imponen.

La confesión del silicio

La pieza decisiva del año pasó casi inadvertida. ByteDance comprometió 5.600 millones de dólares en la compra del chip Ascend 950PR de Huawei. La cifra implica unas 350 mil unidades. Alibaba y Tencent agregaron pedidos por encima de las 500 mil unidades totales. Huawei prevé fabricar 750 mil unidades en 2026.

La aritmética parece victoriosa y es confesional. ByteDance es una compañía que no apuesta por hardware deficiente. Si compra a Huawei en esa escala, lo hace porque no tiene Nvidia. El presupuesto chino para infraestructura doméstica es proporcional al cierre del acceso al silicio extranjero. Cada millón gastado en Ascend es un millón que no llegó a Taiwán.

El Ascend 950PR ofrece compatibilidad CUDA y el detalle es central. Durante una década, el foso competitivo de Nvidia fue el ecosistema de software, no la potencia bruta del chip. Que Huawei replique ese stack significa que los ingenieros chinos pasaron años descomponiendo CUDA en su laboratorio para reproducirlo. Ese trabajo no se hace por vocación de innovación sino por imposibilidad de comprar el original.

DeepSeek V4 fue entrenado, según reportes plausibles, sobre clusters Huawei. Si el dato se confirma, el modelo es la prueba de que el frente chino corrió íntegramente sobre infraestructura doméstica. La hazaña existe.

El rendimiento descontado

SMIC fabrica el 950PR sobre nodos de siete nanómetros con multipatronado. La tasa de rendimiento ronda el 30 al 50%. Por su parte, TSMC alcanza más del 90% en el mismo nodo. Para producir 100 mil chips funcionales, los chinos necesitan procesar entre 200 mil y 330 mil dies. La diferencia se paga en costo, en tiempo y en calor.

El precio doméstico del cómputo en China subió en marzo y abril. Alibaba, Tencent, Baidu y Zhipu elevaron tarifas, pero la oferta no alcanza la demanda. Si el suministro no es suficiente dentro del país, los modelos chinos no pueden servirse al exterior con la fluidez que sus métricas sugieren. DeepSeek mismo admite que la capacidad de servicio para V4-Pro es limitada. La concesión vale más que el lanzamiento.

La ruta de escape

Queda una vía. Las compañías chinas alquilan capacidad de centros de datos en países sin restricciones de exportación. Despliegan los modelos sobre silicio de Nvidia ubicado en el sudeste asiático, en Medio Oriente y en África. La licencia MIT permite que cualquiera ejecute V4 desde cualquier jurisdicción. El código abierto es, paradójicamente, la puerta de salida del bloqueo.

El Departamento de Comercio estadounidense podría cerrar esa puerta en el tercer o cuarto trimestre de 2026. El instrumento ya existe en borradores filtrados y la operación consistiría en restringir la exportación de silicio avanzado a centros de datos sospechosos de servir modelos chinos. Si la medida prospera, la última válvula de escape se cierra.

China entonces deberá producir todo su cómputo dentro de sus fronteras, con yields del 30%, sobre nodos de siete nanómetros, sin acceso a tecnología de chips EUV, es decir, sin TSMC ni ASML.

Lectura del mapa

Los anuncios chinos suelen leerse como demostraciones de fortaleza, pero conviene interpretarlos al revés. Cada gran lanzamiento es un mapa de las restricciones que la compañía hubo de sortear. La eficiencia arquitectónica de V4 es la marca del cómputo escaso. La compatibilidad CUDA de Huawei es la confesión de que sin esa plataforma no había ecosistema. La licencia MIT es la admisión de que el modelo necesita correr fuera del país para escalar.

El modelo es bueno y la estrategia es ingeniosa. Sin embargo, la situación estructural es la que Pekín preferiría no detallar.

China vuelve a las andadas con su política habitual y quiere presentar el remedio como prodigio, la limitación como elección, la astucia forzada como genio originario. La táctica funcionó durante años con paneles solares, baterías y vehículos eléctricos. Funciona menos cuando la materia prima es silicio de cinco nanómetros, porque ese material no se fabrica con voluntarismo sino con máquinas holandesas de ASML que China no puede comprar.

La próxima jugada queda del lado estadounidense. Si el Departamento de Comercio cierra el paréntesis de los centros de datos extranjeros, el modelo V5 de DeepSeek nacerá enteramente sobre Ascend, SMIC y la cadena doméstica entera. Será otra hazaña, pero implicará otra confesión.

Las cosas como son.

Mookie Tenembaum aborda temas internacionales como este todas las semanas junto a Horacio Cabak en su podcast El Observador Internacional, disponible en Spotify, Apple, YouTube y todas las plataformas.

Más noticias

Te puede interesar

Más noticias de Uruguay

Más noticias de España

Más noticias de Estados Unidos