Spirit AI supera a Nvidia en RoboArena Robotics Benchmark

TL; DR
La tabla de clasificación de la startup china Spirit AI RoboArena, creada conjuntamente con Nvidia, obtuvo 1.924 frente a 1.881 de Nvidia, a medida que la IA física se convierte en el próximo campo de batalla tecnológico.
Dos días, el último modelo de robótica de Nvidia estuvo en lo más alto de la clasificación de RoboArena antes de que una startup de Hangzhou lo derribara.
El miércoles, Spirit AI anunció que su modelo base para inteligencia incorporada, Spirit v1.6, obtuvo una puntuación de 1.924 en el punto de referencia, superando a Cosmos3-Nano-Policy de Nvidia con 1.881. Un segundo proyecto de Nvidia, DreamZero, quedó en tercer lugar con 1.763. El benchmark Nvidia desarrollado conjuntamente con la Universidad de Stanford y la Universidad de California, Berkeley, es la primera vez que un modelo chino ocupa el primer puesto en RoboArena.
El momento duele. Nvidia presentó su omnimodelo Cosmos 3 en Computex en Taipei el 1 de junio, llamándolo el "modelo básico de frontera abierta para la IA física". Entrenado con 20 billones de tokens de datos multimodales, se suponía que Cosmos 3 demostraría el dominio de la compañía en una categoría que prácticamente inventó. Spirit AI tenía otros planes.
Lo que realmente mide la IA física
Espacio de coworking de TNW City: donde ocurre tu mejor trabajo
Un espacio de trabajo diseñado para el crecimiento, la colaboración y un sinfín de oportunidades de networking en el corazón de la tecnología.
RoboArena no prueba la fluidez del chatbot ni la calidad de generación de imágenes. Evalúa la eficacia con la que un principio robótico generalizado se traduce en actividades del mundo real: manipulación de objetos, navegación, uso de herramientas, percepción, planificación y adaptabilidad a entornos desconocidos. En resumen, mide si una máquina puede pensar y luego actuar.
La IA física se basa en dos capacidades principales. Las capacidades políticas determinan la capacidad de un modelo para actuar según lo que observa, que es exactamente lo que mide RoboArena. Las capacidades globales determinan la capacidad de un modelo para simular y predecir lo que sucederá a continuación cuando se realice una acción particular.
La industria está avanzando hacia la integración de ambos. En septiembre pasado, investigadores chinos introdujeron una arquitectura unificada de "modelo político mundial" que integra el modelado mundial y la planificación de trayectorias en un solo sistema. Esa convergencia ahora se está acelerando en todos los sectores.
China está a la cabeza en múltiples frentes
El resultado de RoboArena de Spirit AI no es un dato aislado. En todo el amplio ecosistema de puntos de referencia físicos de IA, las empresas chinas se encuentran entre las mejores en casi todas las categorías.
En el benchmark WorldArena, que evalúa modelos de mundos incorporados, el primer puesto pertenece a WorldScape-0.2 de Manifold AI. Superó a Cosmos-Predict 2.5 de Nvidia en la pista del Evaluador de políticas. La pista de realización liderada por AgiBot, una de las empresas de robótica más grandes de China, presentó la semana pasada su modelo GenieEnvisioner-Sim2.0-2B. Encabezando la pista de motores de datos está Dexforce, otra startup china.
En el punto de referencia WorldScore, que prueba la capacidad del modelo para generar mundos a partir de indicaciones de texto, Worldscape-0.2 de Manifold AI lidera nuevamente, superando a WanderJourney, un proyecto conjunto de Stanford y Google.
El dinero entra a raudales
Los resultados tecnológicos están condicionados por una extraordinaria ola de capital. Spirit AI anunció el miércoles una ronda de financiación de 1.500 millones de yuanes (222 millones de dólares), la cuarta en sólo tres meses. Se dice que la medida es la recaudación de fondos más agresiva vista en el sector de la IA incorporada. Rondas anteriores ya han valorado a la empresa en más de 10.000 millones de yuanes (1.400 millones de dólares).
El mismo día, XYZ Embodied AI, producida por la Academia de Inteligencia Artificial de Beijing, dijo que había cerrado su ronda pre-A, recaudando mil millones de yuanes en sólo 10 meses para construir un "cerebro encarnado" y un modelo mundial. Manifold AI ha completado cinco rondas de financiación en 10 meses, y la última obtuvo varios millones de yuanes en abril.
El sector de la robótica chino en general ha atraído 3.400 millones de dólares en financiación de riesgo sólo en 2025, un 42 por ciento más que en Estados Unidos. Parece que esa brecha aumentará en 2026.
La contraestrategia de Nvidia
Nvidia no está arreglada. En Computex, el director ejecutivo Jensen Huang anunció una asociación con la empresa china de robótica Unitree, que está preparando una oferta pública inicial de 7 mil millones de dólares, y el fabricante de manos robóticas de Singapur Sharpa para desarrollar un diseño de referencia de robot humanoide. La plataforma combina el cuerpo humanoide H2 Plus de Unitree, las manos táctiles Sharper Wave y el procesador Jetson AGX Thor T5000 de Nvidia.
Huang también lanzó la Cosmos Coalition, reclutando laboratorios de inteligencia artificial para avanzar en modelos de mundo abierto, incluidos Agile Robots, Black Forest Labs, Runway y Skilled AI. El mensaje es claro: Nvidia quiere ser la capa de infraestructura para todo el ecosistema físico de IA, incluso si los modelos individuales pierden la corona de referencia.
Pero el propio Huang identificó obstáculos fundamentales para el sector. "Para los sistemas robóticos y la IA física, los datos son el problema más difícil", dijo en Computex. Esta admisión indica por qué China puede tener ventajas estructurales.
Consultas de datos
Alexander Wang, el fundador de Scale AI que se unió a Meta en 2025 como su primer director de IA, supuestamente dijo el año pasado que China era "fundamentalmente muy buena en datos" y que muchas empresas estadounidenses dependían de los datos chinos para entrenar modelos básicos de robótica. La afirmación no ha sido verificada de forma totalmente independiente, pero se alinea con principios observables.
En centros tecnológicos como Beijing y Shenzhen, las autoridades chinas han establecido "fábricas de datos" respaldadas por el estado para recopilar datos de entrenamiento en robótica. La cadena de suministro manufacturero de China, con su densa red de fábricas y líneas de montaje, proporciona un entorno natural para datos de interacción robótica del mundo real que son costosos y difíciles de recopilar en Occidente.
Si los datos son realmente el problema más difícil, es posible que el país con más fábricas, más robots y más voluntad de recolectar la mayor cantidad ya tenga la respuesta.




