Oriole implementa la primera red de IA fotónica pura y afirma un recorte del 81%

0 6 4 minutos de lectura

TL; DR

La startup británica Oriole Networks está implementando la primera red de IA fotónica pura del mundo, con una reducción del 81% de la potencia del núcleo y un tiempo de inactividad de la GPU inferior al 1%. El sistema se combina con hardware AMD dentro del Laboratorio de Inferencia de Escalamiento ARIA de £ 50 millones en el Reino Unido.

Durante décadas, las redes dentro de los centros de datos funcionaron con interruptores eléctricos. Consumen mucha energía, generan mucho calor y se convierten cada vez más en cuellos de botella que limitan la rapidez con la que los sistemas de IA pueden procesar e intercambiar datos. Oriole Networks, una startup del Reino Unido, dice que tiene una solución: reemplazar cada interruptor eléctrico en la red central con circuitos ópticos a escala de nanosegundos que enrutan datos como fotones en lugar de electrones.

El lunes, Oriole anunció que implementará lo que describe como el primer sistema de inteligencia artificial a gran escala del mundo impulsado por redes fotónicas puras como parte del ARIA Scaling Inference Lab del Reino Unido. El sistema combina la plataforma de red PRISM de Oriole con GPU AMD Instinct y CPU AMD EPYC. Se trata del primer despliegue comercial de la empresa, con un despliegue industrial más amplio previsto para 2027.

¿Qué hace PRISMA?

PRISM elimina por completo la conmutación de paquetes electrónicos del núcleo de la red. En un centro de datos convencional, los interruptores eléctricos se encuentran entre las GPU e introducen latencia, consumen energía y generan calor. Oriole los reemplaza con conmutación de circuitos ópticos a velocidades de nanosegundos, lo que permite que los fotones viajen directamente de un chip a otro.

Espacio de coworking de TNW City: donde ocurre tu mejor trabajo

Un espacio de trabajo diseñado para el crecimiento, la colaboración y un sinfín de oportunidades de networking en el corazón de la tecnología.

La compañía afirma que reduce el consumo de energía de la red central en un 81%. También dice que el tiempo de inactividad de la GPU cae de aproximadamente el 60% en los sistemas actuales a menos del 1%, porque la red ya no está limitada. Según Oriol, el resultado es un aumento de orden de magnitud en el rendimiento de las conjeturas, lo que significa más tokens por segundo y más usuarios atendidos simultáneamente desde el mismo hardware.

Éstas son afirmaciones importantes. Una reducción de energía del 81 % y un tiempo de inactividad de la GPU inferior al 1 % no se comparan de forma independiente a escala de producción. La implementación de ARIA será la primera prueba real de si el rendimiento del laboratorio se traduce en cargas de trabajo comerciales.

Laboratorio de inferencia de escalamiento ARIA

La implementación se encuentra dentro del ARIA Scaling Inference Lab, un banco de pruebas de £50 millones ($68 millones) financiado por el gobierno del Reino Unido a través de la Agencia de Invención e Investigación Avanzada para abordar las barreras a la inferencia de IA a gran escala. ARIA fue creada por ley del Parlamento y está patrocinada por el Departamento de Ciencia, Innovación y Tecnología. El laboratorio está alojado en CommonAI y está diseñado para probar y optimizar sistemas de IA en condiciones del mundo real.

La inferencia, la fase operativa en la que los modelos entrenados realizan predicciones y producen resultados, representa la mayor parte del costo de cálculo y el consumo de energía de la IA. Esta es la etapa en la que la construcción de una infraestructura global de IA está más limitada por el rendimiento de la red.

"AMD se complace en colaborar con Oriole en el clúster ARIA Scaling Inference Lab." dijo Madhu Rangarajan, vicepresidente corporativo de Compute and Enterprise AI de AMD.La red backend de IA de Oriole con conmutación de circuitos ópticos de nanosegundos representa una forma fundamentalmente diferente de conectar aceleradores a escala."

De la I+D al despliegue en tres años

Oriol se fundó en el Reino Unido y hasta la fecha ha recaudado alrededor de 35 millones de dólares de inversores como Plural, UCL Technology Fund, Clean Growth Fund, XTX Ventures y Dorilton Ventures. La empresa pasó de la investigación al despliegue comercial en tres años, un cronograma inusualmente rápido para el hardware fotónico.

El director ejecutivo, James Regan, enmarcó el anuncio como una transición de la prueba física a la prueba comercial. "Hace un año estábamos probando la física; Hoy estamos demostrando que el negocio"Dijo."Así es como se ve cuando las redes fotónicas dejan de ser una curiosidad de investigación y comienzan a ser la base de cuán seria se vuelve la infraestructura de IA."

Es importante destacar que PRISM está diseñado para ser independiente del chip. Funciona en cualquier plataforma de aceleradores, no solo en AMD, lo que brinda a los operadores de centros de datos un mejor rendimiento de la red sin comprometerse con una pila patentada. Un despliegue industrial más amplio en 2027 probará si esa agnosticidad se mantiene a escala en diferentes configuraciones de hardware.

¿Por qué es importante?

Se prevé que el consumo de energía de los centros de datos de IA se duplique para 2030. La refrigeración por sí sola representa aproximadamente el 40% del consumo de energía de un centro de datos. Las redes añaden otra capa de desperdicio: cada interruptor eléctrico dentro de la GPU quema energía al convertir fotones en electrones y calienta la habitación en el proceso.

Si PRISM está a la altura de sus afirmaciones, el impacto se extenderá más allá del almacenamiento de energía. Una comunicación más rápida entre chips significa un uso más eficiente de la costosa potencia de la GPU, lo que significa un menor costo de inferencia por token. En un mercado donde las empresas ya están luchando con facturas de IA desbocadas, una red que utiliza hardware existente para generar más producción sin comprar más hardware tiene un claro caso de negocio.

La advertencia es que la distancia entre un banco de pruebas financiado por el gobierno y un centro de datos comercial a hiperescala. La implementación de ARIA de Oriole es real, pero aún no funciona a la escala de Meta o Google Cluster. El lanzamiento en 2027 determinará si PRISM puede sobrevivir al salto de un laboratorio respaldado por 50 millones de libras de dinero público a la planta de producción de empresas que gastan cientos de miles de millones en infraestructura de IA. Esta es la brecha donde fallan la mayoría de las startups de hardware.

Source link

Redacción - ACN 8 horas hace

0 6 4 minutos de lectura

Oriole implementa la primera red de IA fotónica pura y afirma un recorte del 81%

TL; DR

¿Qué hace PRISMA?

Laboratorio de inferencia de escalamiento ARIA

De la I+D al despliegue en tres años

¿Por qué es importante?

Redacción - ACN

Leer Siguiente

La oferta pública inicial de SpaceX tuvo un exceso de suscripción ya que la cartera de pedidos se cerró antes de los precios del miércoles.

Stepful recauda 55 millones de dólares para formar a trabajadores sanitarios con IA

Wizz Air instalará Starlink Wi-Fi en sus aviones a partir de 2027

El acuerdo de Amazon con Corning muestra que la fibra es el nuevo obstáculo de la IA

Bending Spoon solicita su salida a bolsa en el Nasdaq en EE.UU.

GALVANY recauda 10 millones de euros para arreglar el mercado alemán de bombas de calor

Casos que podrían darle a la IA su gran momento tabacalero

Moonshot AI busca una valoración de 30 mil millones de dólares, siete veces más en seis meses

Perros robot, drones depredadores y cámaras con inteligencia artificial: la tecnología asegura la Copa del Mundo 2026

El Reino Unido planea comprar chips de IA a empresas británicas para evitar que se trasladen a EE.UU.

La oferta pública inicial de SpaceX tuvo un exceso de suscripción ya que la cartera de pedidos se cerró antes de los precios del miércoles.

Stepful recauda 55 millones de dólares para formar a trabajadores sanitarios con IA

Wizz Air instalará Starlink Wi-Fi en sus aviones a partir de 2027

El acuerdo de Amazon con Corning muestra que la fibra es el nuevo obstáculo de la IA

Bending Spoon solicita su salida a bolsa en el Nasdaq en EE.UU.

GALVANY recauda 10 millones de euros para arreglar el mercado alemán de bombas de calor

Casos que podrían darle a la IA su gran momento tabacalero

Moonshot AI busca una valoración de 30 mil millones de dólares, siete veces más en seis meses

Perros robot, drones depredadores y cámaras con inteligencia artificial: la tecnología asegura la Copa del Mundo 2026

El Reino Unido planea comprar chips de IA a empresas británicas para evitar que se trasladen a EE.UU.

Deja una respuesta Cancelar la respuesta

OpenAI ha agregado el modo de bloqueo a ChatGPT para evitar el robo de datos mediante ataques de inyección rápida

Ubotica e IBM llevan la implementación de IA con un solo clic a Board Satellite

Ecuador aumenta los cortes de energía hasta 14 horas diarias

Hombres armados atacan otro poblado en Haití

Enviado especial de Trump se reúne este viernes con Maduro

Cómo una periodista en Chile logró que un psicópata le confesara crímenes que habían permanecido ocultos durante casi 30 años

TL; DR

¿Qué hace PRISMA?

Laboratorio de inferencia de escalamiento ARIA

De la I+D al despliegue en tres años

¿Por qué es importante?

Leer Siguiente

La oferta pública inicial de SpaceX tuvo un exceso de suscripción ya que la cartera de pedidos se cerró antes de los precios del miércoles.

Stepful recauda 55 millones de dólares para formar a trabajadores sanitarios con IA

Wizz Air instalará Starlink Wi-Fi en sus aviones a partir de 2027

El acuerdo de Amazon con Corning muestra que la fibra es el nuevo obstáculo de la IA

Bending Spoon solicita su salida a bolsa en el Nasdaq en EE.UU.

GALVANY recauda 10 millones de euros para arreglar el mercado alemán de bombas de calor

Casos que podrían darle a la IA su gran momento tabacalero

Moonshot AI busca una valoración de 30 mil millones de dólares, siete veces más en seis meses

Perros robot, drones depredadores y cámaras con inteligencia artificial: la tecnología asegura la Copa del Mundo 2026

El Reino Unido planea comprar chips de IA a empresas británicas para evitar que se trasladen a EE.UU.

Artículos Relacionados

Deja una respuesta Cancelar la respuesta