Oriole implementa la primera red de IA fotónica pura y afirma un recorte del 81%

TL; DR
La startup británica Oriole Networks está implementando la primera red de IA fotónica pura del mundo, con una reducción del 81% de la potencia del núcleo y un tiempo de inactividad de la GPU inferior al 1%. El sistema se combina con hardware AMD dentro del Laboratorio de Inferencia de Escalamiento ARIA de £ 50 millones en el Reino Unido.
Durante décadas, las redes dentro de los centros de datos funcionaron con interruptores eléctricos. Consumen mucha energía, generan mucho calor y se convierten cada vez más en cuellos de botella que limitan la rapidez con la que los sistemas de IA pueden procesar e intercambiar datos. Oriole Networks, una startup del Reino Unido, dice que tiene una solución: reemplazar cada interruptor eléctrico en la red central con circuitos ópticos a escala de nanosegundos que enrutan datos como fotones en lugar de electrones.
El lunes, Oriole anunció que implementará lo que describe como el primer sistema de inteligencia artificial a gran escala del mundo impulsado por redes fotónicas puras como parte del ARIA Scaling Inference Lab del Reino Unido. El sistema combina la plataforma de red PRISM de Oriole con GPU AMD Instinct y CPU AMD EPYC. Se trata del primer despliegue comercial de la empresa, con un despliegue industrial más amplio previsto para 2027.
¿Qué hace PRISMA?
PRISM elimina por completo la conmutación de paquetes electrónicos del núcleo de la red. En un centro de datos convencional, los interruptores eléctricos se encuentran entre las GPU e introducen latencia, consumen energía y generan calor. Oriole los reemplaza con conmutación de circuitos ópticos a velocidades de nanosegundos, lo que permite que los fotones viajen directamente de un chip a otro.
Espacio de coworking de TNW City: donde ocurre tu mejor trabajo
Un espacio de trabajo diseñado para el crecimiento, la colaboración y un sinfín de oportunidades de networking en el corazón de la tecnología.
La compañía afirma que reduce el consumo de energía de la red central en un 81%. También dice que el tiempo de inactividad de la GPU cae de aproximadamente el 60% en los sistemas actuales a menos del 1%, porque la red ya no está limitada. Según Oriol, el resultado es un aumento de orden de magnitud en el rendimiento de las conjeturas, lo que significa más tokens por segundo y más usuarios atendidos simultáneamente desde el mismo hardware.
Éstas son afirmaciones importantes. Una reducción de energía del 81 % y un tiempo de inactividad de la GPU inferior al 1 % no se comparan de forma independiente a escala de producción. La implementación de ARIA será la primera prueba real de si el rendimiento del laboratorio se traduce en cargas de trabajo comerciales.
Laboratorio de inferencia de escalamiento ARIA
La implementación se encuentra dentro del ARIA Scaling Inference Lab, un banco de pruebas de £50 millones ($68 millones) financiado por el gobierno del Reino Unido a través de la Agencia de Invención e Investigación Avanzada para abordar las barreras a la inferencia de IA a gran escala. ARIA fue creada por ley del Parlamento y está patrocinada por el Departamento de Ciencia, Innovación y Tecnología. El laboratorio está alojado en CommonAI y está diseñado para probar y optimizar sistemas de IA en condiciones del mundo real.
La inferencia, la fase operativa en la que los modelos entrenados realizan predicciones y producen resultados, representa la mayor parte del costo de cálculo y el consumo de energía de la IA. Esta es la etapa en la que la construcción de una infraestructura global de IA está más limitada por el rendimiento de la red.
"AMD se complace en colaborar con Oriole en el clúster ARIA Scaling Inference Lab." dijo Madhu Rangarajan, vicepresidente corporativo de Compute and Enterprise AI de AMD.La red backend de IA de Oriole con conmutación de circuitos ópticos de nanosegundos representa una forma fundamentalmente diferente de conectar aceleradores a escala."
De la I+D al despliegue en tres años
Oriol se fundó en el Reino Unido y hasta la fecha ha recaudado alrededor de 35 millones de dólares de inversores como Plural, UCL Technology Fund, Clean Growth Fund, XTX Ventures y Dorilton Ventures. La empresa pasó de la investigación al despliegue comercial en tres años, un cronograma inusualmente rápido para el hardware fotónico.
El director ejecutivo, James Regan, enmarcó el anuncio como una transición de la prueba física a la prueba comercial. "Hace un año estábamos probando la física; Hoy estamos demostrando que el negocio"Dijo."Así es como se ve cuando las redes fotónicas dejan de ser una curiosidad de investigación y comienzan a ser la base de cuán seria se vuelve la infraestructura de IA."
Es importante destacar que PRISM está diseñado para ser independiente del chip. Funciona en cualquier plataforma de aceleradores, no solo en AMD, lo que brinda a los operadores de centros de datos un mejor rendimiento de la red sin comprometerse con una pila patentada. Un despliegue industrial más amplio en 2027 probará si esa agnosticidad se mantiene a escala en diferentes configuraciones de hardware.
¿Por qué es importante?
Se prevé que el consumo de energía de los centros de datos de IA se duplique para 2030. La refrigeración por sí sola representa aproximadamente el 40% del consumo de energía de un centro de datos. Las redes añaden otra capa de desperdicio: cada interruptor eléctrico dentro de la GPU quema energía al convertir fotones en electrones y calienta la habitación en el proceso.
Si PRISM está a la altura de sus afirmaciones, el impacto se extenderá más allá del almacenamiento de energía. Una comunicación más rápida entre chips significa un uso más eficiente de la costosa potencia de la GPU, lo que significa un menor costo de inferencia por token. En un mercado donde las empresas ya están luchando con facturas de IA desbocadas, una red que utiliza hardware existente para generar más producción sin comprar más hardware tiene un claro caso de negocio.
La advertencia es que la distancia entre un banco de pruebas financiado por el gobierno y un centro de datos comercial a hiperescala. La implementación de ARIA de Oriole es real, pero aún no funciona a la escala de Meta o Google Cluster. El lanzamiento en 2027 determinará si PRISM puede sobrevivir al salto de un laboratorio respaldado por 50 millones de libras de dinero público a la planta de producción de empresas que gastan cientos de miles de millones en infraestructura de IA. Esta es la brecha donde fallan la mayoría de las startups de hardware.




