Tecnología · Curado el 12 may 2026, 08:41 p. m. · Santiago

DeepSeek R2 supera a GPT-4o en benchmarks de razonamiento matemático y código

El laboratorio chino de IA vuelve a sorprender con un modelo que iguala o supera a los líderes de EE.UU. a una fracción del costo de entrenamiento.

01El hechoQué pasó, sin interpretación

DeepSeek, laboratorio de inteligencia artificial con sede en Hangzhou, publicó en marzo de 2026 su modelo R2, que supera a GPT-4o de OpenAI en los benchmarks MATH-500 (92,1% vs 88,4%) y HumanEval de generación de código (94,3% vs 90,2%), según resultados publicados por el propio DeepSeek y validados por el benchmark independiente LMSYS Chatbot Arena. El costo reportado de entrenamiento fue inferior a USD 6 millones, frente a estimaciones de USD 100 millones o más para modelos equivalentes de OpenAI y Google.

02El contextoCómo se conecta con la cadena más grande

DeepSeek opera en China bajo restricciones de exportación de chips avanzados de EE.UU. (reglas de octubre 2022 y octubre 2023). El equipo ha desarrollado técnicas de entrenamiento eficiente —Mixture of Experts, optimización de atención multi-head— que reducen requerimientos de cómputo. El modelo R1, lanzado en enero de 2025, ya había generado pánico en mercados financieros de EE.UU. al demostrar capacidad comparable a modelos de frontera con costo radicalmente menor. R2 profundiza esa trayectoria.

Lectura LATAM

Qué significa para quien decide en América Latina

01Para empresas latinoamericanas que evalúan adopción de IA, DeepSeek ofrece modelos de código abierto o bajo costo de API que compiten con OpenAI y Anthropic.
02El costo es relevante: una empresa mediana chilena o colombiana puede acceder a capacidad de IA de frontera sin los contratos enterprise de Microsoft Azure o Google Cloud.
03[Inferencia] La competencia entre laboratorios chinos y estadounidenses beneficia directamente a usuarios y empresas en mercados emergentes, que acceden a mejor tecnología a menor costo.
04El riesgo es la dependencia de modelos cuya cadena de toma de decisiones puede estar sujeta a regulación china.
05[Inferencia] Si DeepSeek mantiene su trayectoria de mejora con eficiencia de cómputo, el paradigma de que los modelos de frontera requieren inversiones de miles de millones de dólares quedará obsoleto.

Cómo construimos esta lectura

Cada inferencia se sostiene sobre tres pilares: el hecho verificado arriba, el contexto de la cadena en la que ocurre, y fuentes primarias cruzadas (organismos oficiales, prensa especializada y datos comerciales). La Lectura LATAM no es opinión: es la consecuencia editorial aplicada al sector de quien decide en la región.

Fuente: DeepSeek Technical Report R2 · 2026 / LMSYS Chatbot Arena · 2026 · Ver fuente original ↗