Nebius adquiere Eigen AI de 20 personas por 643 millones de dólares a medida que la optimización predictiva se convierte en la capa más valiosa de la infraestructura de IA

TL; DR
Nebius, la neonube holandesa que se escindió de Yandex en 2024, acordó adquirir Eigen AI por 643 millones de dólares, valorando la startup de 20 ex alumnos del MIT en alrededor de 32 millones de dólares por empleado. La tecnología de optimización de inferencias de Aizen maximiza los tokens en las GPU de Nvidia, las capacidades más valiosas en la infraestructura de IA. El acuerdo fortalece la plataforma de inferencia de fábrica de tokens de Nebius a medida que el mercado de neocloud se expande rápidamente con CoreWave y FluidStack recaudando miles de millones.
Nebius Group, la empresa holandesa de computación en la nube que se escindió del proveedor ruso de Internet Yandex en 2024, acordó adquirir Eisen AI por alrededor de 643 millones de dólares en acciones y efectivo. El acuerdo, anunciado el 1 de mayo, es para una startup de 20 personas fundada por ex alumnos del HAN Lab del MIT. En un mercado donde las empresas de IA más grandes valen cientos de miles de millones y las adquisiciones más destacadas involucran a miles de ingenieros, es necesario explicar 643 millones de dólares para 20 personas. Las explicaciones son suposiciones. La tecnología de Eigen AI maximiza la cantidad de tokens, la unidad básica de datos en modelos de lenguaje grandes, que cada chip Nvidia puede generar cuando se ejecutan modelos de IA. "Es como los juegos olímpicos del mercado actual: ¿quién puede extraer más tokens por el mismo precio?" dijo Roman Chernin, cofundador y director comercial de Nebius. Los miembros del equipo propio, dijo, "Como corredores olímpicos en esta disciplina."Resulta que la disciplina vale 32 millones de dólares por persona.
la economia
El problema más caro en la industria de la IA no es el entrenamiento de modelos. Los impulsa. Entrenar un modelo de frontera es un gasto de capital único, medido en millones de dólares, que genera un conjunto de ponderaciones. La inferencia, el proceso de ejecutar estos pesos para generar respuestas para los usuarios, es un costo operativo recurrente que aumenta con cada consulta, cada llamada API y cada token producido. Para las empresas que venden IA como servicio, la estimación es la línea de costos dominante. Suponiendo que cada punto porcentual de eficiencia ganado, cada token adicional extraído de la misma GPU Nvidia se traduce directamente en menores costos o mayores márgenes. Eigen AI se especializa precisamente en eso: optimizar el rendimiento de los modelos de código abierto de OpenAI, Alibaba, Meta y Nvidia para que cada chip produzca más producción con la misma entrada de electricidad y silicio.
La técnica que hizo notables a los fundadores de Eizen AI es la cuantificación de peso basada en la activación, un método para comprimir modelos de IA desde formatos numéricos de alta precisión a formatos numéricos de baja precisión sin una pérdida significativa de calidad de salida. El cofundador Wei-Chen Wang recibió el premio MLSys 2024 Best Paper Award por este trabajo. En la práctica, la cuantificación permite que un modelo que normalmente requeriría de dos a cuatro GPU, o un modelo que se ejecuta en una GPU, genere tokens dos veces más rápido. Para un proveedor de nube como Nebius, que recaudó 700 millones de dólares de Nvidia y Accel para desarrollar su flota de GPU, la capacidad de extraer más valor de cada chip cambia la economía unitaria de todo el negocio.
adquiridor
Nebius ocupa una posición específica en el mercado de infraestructuras de IA. Es un grupo de empresas llamado “Neonube," proveedores de nube que alquilan potencia informática de IA a empresas en lugar de crear productos de consumo. Los hiperescaladores establecidos, AWS, Microsoft Azure y Google Cloud, dominan el mercado de la nube en general, pero las neonubes se han hecho un hueco al ofrecer una infraestructura optimizada para IA con bajos gastos generales, y su GPU de centro de datos se implementa rápidamente en Trividia NBIPU. Finlandia, Nvidia está implementando el chip H200 y abriendo un centro de datos en París como parte de un plan de inversión europeo de mil millones de dólares. presentó Token Factory, un producto de conjeturas administradas que compite con nuevas empresas como Fireworks y Beseten, así como con las propias ofertas de conjeturas de Hyperscaler.
La adquisición de Eigen AI tiene como objetivo hacer de Token Factory la plataforma de inferencia más eficiente del mercado. Con la capa de optimización de Eigen integrada en la fábrica de tokens, Nebius puede ofrecer a los clientes un menor costo por token o un mayor rendimiento desde el mismo hardware, una ventaja competitiva en un mercado donde los precios son transparentes y los costos de cambio son bajos. El mercado de la neonube se está expandiendo rápidamente, con empresas como CoreWave firmando acuerdos de infraestructura por valor de miles de millones. FluidStack, otra neonube, está en conversaciones para recaudar mil millones de dólares con una valoración de 18 mil millones de dólares. La dinámica competitiva es clara: gana quien pueda ofrecer la mayor cantidad de tokens por GPU por dólar.
estrategia
El acuerdo con Eigen es la segunda adquisición de Nebius en tres meses, luego de la compra de la empresa de búsqueda de agentes de inteligencia artificial Tavily por 275 millones de dólares en febrero. Chernin dijo que la empresa está analizando otras oportunidades de contrato. El patrón sugiere una estrategia para adquirir equipos pequeños y técnicamente excelentes cuyas capacidades tardarían años en desarrollarse internamente. Eigen AI cuenta con 20 personas y una pila de optimización de nivel de producción. Tavily aporta infraestructura de búsqueda para agentes de IA. Ambas adquisiciones agregan capacidades que hacen avanzar a Nebius, pasando de alquilar capacidad de GPU sin procesar a brindar servicios de alto valor que interactúan directamente con los clientes.
"No queremos ser infraestructura y alguien por encima de nosotros trabaja con clientes reales,"Dijo Chernin. Ese es el dilema de la neonube en una frase. Alquilar capacidad de GPU es rentable pero está mercantilizado. Los márgenes mejoran a medida que se acerca a la capa de aplicación: desde la computación en bruto hasta la inferencia administrada, el servicio de modelos optimizado, el ajuste de las canalizaciones y los puntos finales de nivel empresarial. Tecnología de interconexión entre puntos finales de nivel empresarial y tecnologías de computación. Servicio, donde el valor de la infraestructura de IA está cambiando. El precio de 643 millones de dólares, aproximadamente 32 millones de dólares por empleado, refleja un mercado en el que no son los chips ni el capital, sino las personas que saben cómo fabricarlos, los que fabrican más tokens por menos, vendiéndolos a un costo menor que con menos suministros de energía. Cobra un precio superior por acuerdos a granel de varios años, contratos de inferencia con poca antelación, si cada GPU fabrica tantos tokens como sea posible.




