EEUU – En un recordatorio brutal de la fragilidad de nuestra infraestructura digital, Amazon Web Services (AWS), el gigante de la computación en la nube, sufrió una interrupción masiva que paralizó servicios esenciales en todo el mundo durante varias horas esta madrugada.
La falla, que inició alrededor de las 3:00 a.m. hora del Este (EE.UU.), afectó a más de 500 empresas y plataformas, desde bancos y aerolíneas hasta apps de mensajería y videojuegos, dejando a millones de usuarios en la oscuridad digital.
¿Qué Pasó y Cuál Fue el Alcance?
Según el panel de estado de AWS, el problema se originó en la región US-EAST-1 (Virginia del Norte), donde un error en la resolución de DNS del endpoint de la API de DynamoDB –un servicio clave de bases de datos– provocó un efecto dominó. Esto generó tasas elevadas de errores y latencias en más de 78 servicios de AWS, incluyendo EC2 (computación elástica), Lambda (servidores sin servidor) y SQS (colas de mensajes).
Aunque AWS reporta que el núcleo del incidente se mitigó completamente a las 3:35 a.m. PDT, persisten retrasos en la creación de nuevas instancias de EC2 y en la recuperación de colas de solicitudes pendientes, lo que podría extender las disrupciones residuales hasta el mediodía.El impacto fue global y transversal.
Plataformas como Snapchat, Venmo, Coinbase, Roblox, Fortnite y Duolingo reportaron caídas totales, con picos de quejas en DownDetector que superaron las decenas de miles de reportes por hora.
En el sector financiero, Lloyds Banking Group en el Reino Unido vio interrumpidos sus servicios en línea, mientras que en EE.UU., apps como Robinhood y servicios de pagos como Venmo dejaron a usuarios sin acceso a sus fondos. Las aerolíneas no se salvaron: United y Delta confirmaron problemas en sus apps y sitios web, aunque no se reportaron retrasos masivos en vuelos hasta el momento.
Incluso dispositivos cotidianos como las cámaras Ring (de Amazon) y enchufes inteligentes quedaron inoperativos, exponiendo vulnerabilidades en hogares conectados.En redes sociales, el caos se multiplicó.
Usuarios en X (antes Twitter) inundaron las tendencias con quejas: «AWS down on a Monday. Jesus», tuiteó un desarrollador frustrado, mientras otro bromeaba: «The world if AWS stays down for a few more days», acompañando un video apocalíptico.
En Disney World, el outage forzó operaciones manuales en buses, pasando de rutas dinámicas a fijas por falta de comunicaciones.Respuesta de AWS y Empresas AfectadasAmazon emitió actualizaciones constantes en su Health Dashboard, confirmando que aplicaron mitigaciones en múltiples zonas de disponibilidad y recomendando a clientes reintentos de solicitudes y configuraciones multi-zona para evitar futuros impactos.
«Estamos trabajando en múltiples vías paralelas para acelerar la recuperación», indicaron en un comunicado. A las 6:29 a.m. ET, reportaron que la mayoría de los sitios y apps ya operaban normalmente, aunque con posibles «retrasos persistentes» en el procesamiento de backlogs.Empresas dependientes de AWS reaccionaron con rapidez. Snapchat tuiteó: «Estamos al tanto de que algunos usuarios tienen problemas con la app – aguanten, lo estamos investigando».
Coinbase aseguró que «todos los fondos están seguros» y que el acceso se restauraba progresivamente. Perplexity AI, el motor de búsqueda impulsado por IA, culpó directamente al outage de AWS por su caída temporal. Incluso Amazon.com y sus filiales, como el soporte al cliente, sufrieron interrupciones internas.Lecciones de una Dependencia ExcesivaEste no es un incidente aislado.
AWS, que controla cerca del 33% del mercado de nube con ingresos de $108 mil millones en 2024, ha enfrentado fallas similares en 2021 y 2023, cada una exponiendo la centralización del internet moderno.
Expertos advierten que nuestra reliance en unos pocos proveedores como AWS, Azure y Google Cloud crea un «punto único de falla» global.
«Esto no es un fallo del sistema; es exactamente como está diseñado», ironizó un usuario en X, aludiendo a cómo las ganancias corporativas priorizan la eficiencia sobre la redundancia.
Mientras AWS trabaja en la resolución total –con una actualización esperada para las 8:00 a.m. PDT–, el outage subraya la necesidad urgente de diversificación en infraestructuras digitales. Para gobiernos, bancos y consumidores, la pregunta persiste: ¿Cuánto más podemos depender de un solo titán de la nube antes de que el siguiente «lunes negro» nos deje desconectados por completo?