Inside Automat: su manual para escalar nuevas empresas de IA en AWS
El auge de la IA ha cambiado fundamentalmente la forma en que las startups piensan sobre la infraestructura. El viaje de escalamiento de la nube, que alguna vez fue relativamente sencillo, se ha vuelto mucho más complejo, a medida que las empresas ahora equilibran cargas de trabajo intensivas en GPU, modelos de IA en rápida evolución, requisitos de cumplimiento y costos operativos crecientes. Para muchas empresas emergentes, el desafío ya no es simplemente llevar un producto al mercado. Se trata de mantener las operaciones en la nube sostenibles y al mismo tiempo escalar lo suficientemente rápido como para competir.
Al mismo tiempo, AWS ha evolucionado hasta convertirse en mucho más que una plataforma de alojamiento. Para las nuevas empresas que crean productos nativos de IA, se ha convertido en una capa de orquestación para todo, desde los canales de implementación hasta la gobernanza generativa de la IA. Según Ziv Kashtan, director ejecutivo de Automat-it, las nuevas empresas que escalan con mayor éxito tratan la arquitectura de la nube como una ventaja estratégica en lugar de una idea de último momento.
El costo oculto de escalar demasiado rápido
"Al principio, descubrimos que las empresas emergentes de rápido crecimiento a menudo permitían que su nube costara más que sus ingresos."dice Kashtan. Esta observación ha dado forma a Automat: su énfasis en la optimización continua de FinOps como parte de su enfoque de servicios administrados de AWS.
La empresa, socio Premier de AWS especializada en nuevas empresas, ha apoyado a miles de empresas en su paso del MVP a la producción. Lo que comenzó como una empresa centrada en DevOps se ha convertido en una empresa de servicios de IA que ayuda a las nuevas empresas a ejecutar flujos de trabajo de IA cada vez más complejos en AWS.
Kashtan dice que uno de los mayores conceptos erróneos que tienen los fundadores es creer que simplemente migrar a AWS garantiza la eficiencia.
"Levantar y cambiar son lo suficientemente buenos"Dice, describiendo una mentalidad común entre las nuevas empresas".AWS es como Lego. Puedes construir cualquier cosa sobre él. Pero fácilmente puedes perderte todas las cosas buenas."
Otra idea errónea es que los servicios gestionados son intrínsecamente más caros que construir todo internamente. Según Kashtan, las startups a menudo subestiman los costos ocultos de mantenimiento, parches, tiempo de inactividad y gestión ineficiente de recursos.
El dolor suele surgir cuando las startups pasan de la ejecución inicial al modo de escalamiento real. De repente, las estimaciones de IA cuestan más, las implementaciones se vuelven cada vez más frágiles y los equipos de ingeniería dedican más tiempo a lidiar con interrupciones que a crear productos.
"En la práctica, esto puede parecerse a los costos de la IA y la GPU, donde las nuevas empresas luchan por mantener una economía unitaria sostenible.Kashtan explica.
Por qué es importante la madurez de DevOps
Uno de los errores arquitectónicos más constantes es la automatización: hace que las nuevas empresas retrasen la disciplina operativa hasta la siguiente fase de crecimiento. Los equipos a menudo evitan las zonas de aterrizaje de AWS con múltiples cuentas, dependen del aprovisionamiento manual a través de la consola de AWS o implementan sistemas monolíticos que son difíciles de escalar.
"A menudo vemos equipos que aprovisionan recursos manualmente a través de la interfaz de usuario web de AWS en lugar de depender de la infraestructura como código.dijo Kashtán.
Para las empresas emergentes de alto crecimiento, la madurez de DevOps está directamente relacionada con la velocidad y la resiliencia. Los canales maduros de CI/CD, las pruebas automatizadas y la infraestructura como código permiten que las empresas emergentes se implementen más rápido, lo que reduce la fricción operativa.
Kashtan sostiene que las startups más efectivas adoptan "resultados por encima de los productos", subcontratando la gestión continua de la infraestructura para que los equipos internos puedan centrarse en la innovación propia.
"A medida que DevOps madura, los equipos de ingeniería quedan liberados para centrarse por completo en sus productos principales." ella dice.
Esa madurez operativa también se aplica cada vez más a las cargas de trabajo de IA. Muchas startups se lanzan a la producción con impresionantes demostraciones de IA, solo para descubrir que la observabilidad, la gobernanza y el control de costos a nivel de producción son problemas significativamente más difíciles de resolver.
Cómo se ve un entorno de AWS bien optimizado
Según Kashtan, los entornos de inicio bien optimizados en AWS comparten varias características comunes.
Priorizan la infraestructura como código desde el primer día utilizando herramientas como Terraform o AWS CDK. Implementan estrategias de múltiples cuentas para el aislamiento de seguridad y la preparación para el cumplimiento. Adoptan entornos informáticos elásticos como Amazon EKS Auto Mode o Amazon ECS on Forget para reducir la carga operativa y optimizar los costos.
Especialmente en entornos de IA, Automat-IT aboga por estrategias de modelos de varios niveles utilizando Amazon Bedrock, donde las tareas simples se dirigen a modelos de bajo costo mientras que los modelos premium se reservan para cargas de trabajo lógicas más avanzadas.
"Los equipos cometen el error de utilizar un LLM único y premium para todo,dijo Kashtán.Una estrategia de modelo de múltiples capas mejora drásticamente la eficiencia."
La automatización desempeña un papel cada vez más importante en la reducción de los gastos operativos. Kashtan señala la gestión de costos de la nube, los canales de CI/CD, la recopilación de evidencia de cumplimiento y la orquestación de agentes donde la automatización nativa de AWS puede reducir significativamente la carga de ingeniería.
Reducción de doce veces los costos de infraestructura de IA
Un ejemplo que destaca Automat-it es su trabajo con mokSa.ai, una startup de inteligencia de video que enfrenta costos de infraestructura insostenibles.
La arquitectura central de la empresa se basa en un modelo de IA por instancia de GPU dedicada, lo que eleva los costos a 353 dólares por cámara al mes. Auto-it rediseñó la plataforma utilizando Amazon EKS e implementó la división de tiempo de GPU NVIDIA para permitir que múltiples modelos de IA compartan recursos de GPU virtuales simultáneamente.
"El resultado fue una increíble reducción de costos doce veces, a solo $27 por mes por cámara, manteniendo los tiempos de estimación dentro del umbral requerido de 500 ms.dijo Kashtán.
El panorama de AWS en 2026
De cara al futuro, Kashtan cree que AWS seguirá evolucionando hacia una capa de orquestación administrada para sistemas de IA agentes, eliminando gran parte de la complejidad de la infraestructura con la que luchan actualmente las empresas emergentes.
"Con regulaciones más estrictas como la Ley de IA de la UE que entrará en vigor en agosto de 2026, las herramientas de gobernanza y trazabilidad integradas de AWS se convertirán en mecanismos de supervivencia críticos para las empresas emergentes de alto riesgo." ella dice.
Para los fundadores que hoy construyen en AWS, su consejo es, en última instancia, sencillo: "Céntrese en su producto principal y asóciese para el resto".




