Amazon publicó un informe detallado sobre la interrupción global que afectó a numerosos servicios y plataformas el pasado 20 de octubre. El fallo tuvo su origen en un error dentro de su sistema de automatización DynamoDB, base sobre la que funcionan miles de aplicaciones y servicios que usan la infraestructura de AWS.
El problema comenzó cuando el sistema de gestión de DNS de DynamoDB generó un registro vacío en los centros de datos de Virginia del Norte, lo que impidió que los clientes pudieran conectarse correctamente. Según el informe de Amazon, el software debía corregir el fallo de forma automática, pero no lo hizo, lo que obligó a la compañía a intervenir manualmente para restablecer el servicio.
Mientras el error persistía, los sistemas que dependían de DynamoDB, incluidos los servicios de computación en la nube de AWS, presentaron fallos de conexión. Durante las horas de la interrupción, múltiples aplicaciones y sitios web quedaron fuera de línea o respondieron con lentitud.
TE PUEDE INTERESAR: ¿Horas viendo Shorts? YouTube ahora te dirá cuándo hacer una pausa
Impacto y medidas tras la interrupción de Amazon Web Services
- Los servicios afectados incluyeron Amazon, Alexa, Bank of America, Snapchat, Canva, Reddit, Apple Music, Apple TV, Lyft, Duolingo, Fortnite, Disney+, Venmo, DoorDash, Hulu, PlayStation y Eight Sleep.
- Algunos servicios experimentaron solo demoras, mientras que otros quedaron completamente inaccesibles.
- El error en el registro DNS impidió la comunicación entre los sistemas internos y los clientes de AWS.
- La incidencia se concentró en los centros de datos de Virginia del Norte, una de las regiones más críticas de Amazon Web Services.
- Amazon aseguró que implementará medidas adicionales para evitar que un error similar se repita.
- En su comunicado, la empresa reconoció el impacto significativo en los usuarios y reiteró su compromiso de mejorar la disponibilidad de sus servicios.
Foto: Amazon.
