TECNOLOGIA

El cofundador de Databricks, Matei Zaharia, ganó un premio ACM y anunció que AGI ya está aquí

En resumen: Mati Zaharia, profesora de informática de Berkeley y cofundadora de Databricks que desarrolló Apache Spark, ganó el Premio ACM en Computación 2026 por sus contribuciones fundamentales a los sistemas de datos distribuidos y la infraestructura de inteligencia artificial. El premio de 250.000 dólares, financiado por una donación de Infosys, es uno de los honores de mitad de carrera más prestigiosos en ciencias de la computación. Zaharia donará el premio a organizaciones benéficas. En una entrevista después del anuncio, argumentó que AGI ya había llegado, "simplemente no está en una forma que apreciamos", y que el campo debería dejar de comparar la IA con la cognición humana.

De la tesis doctoral a la infraestructura global

Zaharia comenzó a construir Apache Spark como estudiante de doctorado en UC Berkeley en 2009, una alternativa rápida a Hadoop MapReduce, que se había convertido en el marco predeterminado para el procesamiento de datos distribuidos a gran escala, pero estaba sobrecargado por una lenta E/S basada en disco entre etapas. Spark trasladó la computación intermedia a la memoria, reduciendo el tiempo de procesamiento para cargas de trabajo repetitivas, capacitación en aprendizaje automático, procesamiento de gráficos y análisis de flujo, de horas a minutos o segundos. La brecha de rendimiento fue lo suficientemente significativa como para que Spark superara efectivamente a Mapridus en la mayoría de las cargas de trabajo analíticas a los pocos años de su lanzamiento. Es uno de los marcos de procesamiento de datos más implementados en el mundo. La tesis doctoral de Zaharia sobre Spark ganó el Premio de Tesis Doctoral ACM en 2014, y el proyecto se convirtió en la semilla de Databricks, la empresa de datos e inteligencia artificial que cofundó en 2013 con seis colegas de Berkeley. Databricks alcanzó una valoración de 134.000 millones de dólares en diciembre de 2025 tras su ronda de financiación Serie L y registró una tasa de ingresos de 5.400 millones de dólares en febrero de 2026, con un crecimiento de más del 65 % año tras año. ACM, en su mención del premio, le dio crédito a Zaharia por "el desarrollo visionario de sistemas de datos distribuidos e infraestructuras informáticas que han permitido el aprendizaje automático, el análisis y la inteligencia artificial a gran escala en todo el mundo". En el ecosistema de código abierto que Zaharia ha ayudado a popularizar, Apache Spark tiene la licencia Apache 2.0, la misma licencia que Google usó la semana pasada para su familia de modelos de peso abierto Gemma 4, convirtiéndose en el marco predeterminado para los lanzamientos de modelos y herramientas de IA destinados a una amplia adopción comercial.

Delta Lake, MLFlow y Data Lakehouse

Las contribuciones de Zaharia no se limitaron a Spark. A medida que la infraestructura de datos se trasladó a la nube y las organizaciones comenzaron a almacenar grandes cantidades de datos no estructurados en almacenes de objetos como Amazon S3, surgió una nueva serie de problemas: los lagos de datos en la nube eran rápidos y baratos pero poco confiables, sin garantías de transacciones, sin aplicación consistente de esquemas y sin políticas para manejar escrituras concurrentes. Zaharia codesarrolló Delta Lake para resolver esto, llevando la semántica de transacciones ACID a los almacenes de objetos en la nube y habilitando un nuevo patrón arquitectónico, el data lakehouse, que combina las ventajas de costo y escala de un lago de datos con las características de coherencia y gobernanza de un almacén de datos tradicional. La arquitectura Lakehouse es ahora el producto comercial principal de Databricks y se ha adoptado ampliamente en toda la ingeniería de datos empresariales. Un tercer proyecto, MLFlow, abordó el caos operativo que surgió cuando el aprendizaje automático pasó de la investigación a la producción. Los equipos que creaban modelos de ML no tenían una forma consistente de probar, rastrear modelos de versiones o administrar implementaciones en diferentes herramientas, Skit-Learn, TensorFlow, PyTorch, XGBOST, que una sola organización pudiera usar simultáneamente. MLflow proporciona un marco de ciclo de vida estructurado que se ha convertido en una plataforma líder para implementar IA a escala.

Agentes, DSPy y fronteras actuales de la investigación

La investigación reciente de Zaharia ha pasado de la infraestructura de datos a sistemas que hacen que los agentes de IA sean más confiables y capaces. Es coautor de DSPy, un marco de código abierto que optimiza automáticamente las indicaciones y parámetros utilizados para instruir a los modelos de lenguaje para tareas específicas, reemplazando la ingeniería de indicaciones manual que se ha convertido en una fuente importante de fragilidad en los sistemas de producción de IA. Un proyecto relacionado, GEPA, amplía este enfoque a la calidad de los agentes, cómo mejorar la confiabilidad de los flujos de trabajo de IA de varios pasos donde los errores persisten en decisiones secuenciales. El hilo conductor a lo largo de la carrera de Zaharia es el pensamiento sistémico aplicado a aquellas partes de la IA que no son modelos en sí mismas: canales de datos, seguimiento de experimentos, infraestructura de implementación y ahora la capa de orquestación de agentes. El ecosistema de implementación de IA empresarial que se ha desarrollado en torno a estas herramientas es ahora un mercado comercial importante por derecho propio: Infosys, que financia el Premio ACM a través de su donación, es también uno de los socios ancla de la Cloud Partner Network de Anthropic, que se lanzó en marzo de 2026 con 100 millones de dólares, que no existiría sin los datos empresariales. La infraestructura de ML hace que el trabajo de código abierto de Zaharia sea accesible. "Lo que más me emociona,En una entrevista con TechCrunch, Zaharia dijo:Me refiero a IA para exploración, pero especialmente para investigación o ingeniería."Él imagina a estudiantes e investigadores utilizando IA para simular cambios a nivel molecular en sistemas biológicos y predecir sus resultados, investigación científica autónoma a una escala y velocidad que ningún equipo humano puede replicar.

"AGI ya está aquí", el reclamo y lo que significa

El momento que más llamó la atención del anuncio no fue el premio, sino que Zaharia hizo una declaración sobre el estado de la IA. "AGI ya está aquí" le dijo a TechCrunchEs sólo una forma que no apreciamos"La afirmación es provocativa, pero su explicación detallada aclara lo que dice y lo que no dice. La definición convencional de inteligencia artificial general, un sistema capaz de realizar cualquier tarea intelectual que un ser humano pueda realizar, establece una comparación entre la IA y la cognición humana que, según Zaharia, es el marco equivocado".Deberíamos dejar de intentar aplicar valores humanos a estos modelos de IA", dijo. Su argumento es que las capacidades de los sistemas de IA actuales son estructuralmente diferentes de la inteligencia humana en lugar de simplemente débiles. Un humano sólo puede aprobar el examen de la abogacía si ha acumulado una gran cantidad de conocimientos jurídicos a lo largo de años de estudio; una IA puede absorber el mismo corpus en minutos. Si responde correctamente a las preguntas legales, el punto de Zaharia era "realmente incómodo" porque era "el tema". Un estándar arbitrario se ganaba de manera diferente. El debate sobre cómo definir y medir el progreso de la IA está dando forma a las estrategias competitivas en los principales laboratorios: Demis Hassabis describió recientemente cómo Google DeepMind se ha reinventado para acelerar el ritmo de la investigación, caracterizando la carrera actual de la IA como "violento"y"Históricamente intensoLa redefinición de AGI que hace Zaharia es menos una afirmación ganadora que un argumento metodológico: la insistencia del campo en medir la IA con respecto a los estándares humanos puede llevar a una mala comprensión de lo que los sistemas ya construidos son realmente capaces de hacer. La prueba comercial de esa capacidad se está acumulando rápidamente, con Anthropic, cuyos modelos se ejecutan en la infraestructura de datos que ayudó a normalizar el trabajo de código abierto de Zaharia, alcanzando una tasa de ingresos anuales de 30 mil millones de dólares a principios de este año. 2025 marca el cambio en la IA de la innovación en investigación a la infraestructura operativa, y Zaharia, cuya carrera siempre ha estado en un nivel por debajo de lo que todos ven, continúa sentando las bases para esa transición desde su doctorado.

Source link

Redacción - ACN

Somos un portal de noticias líder en la República Dominicana que se especializa en ofrecer una cobertura informativa integral. Desde eventos políticos y económicos hasta avances científicos y noticias de entretenimiento, este sitio web es tu fuente confiable para mantenerse al día con los acontecimientos más relevantes tanto a nivel nacional como internacional. Además de ofrecer informes actualizados, ACN también se destaca por sus análisis en profundidad y sus entrevistas exclusivas que proporcionan una comprensión más completa de las noticias.

Artículos Relacionados

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Volver arriba botón