De omvangrijke storing in één van de clouddiensten van Amazon afgelopen dinsdag werd door een menselijke fout veroorzaakt, zo heeft het bedrijf bekendgemaakt. Tijdens de storing was de Amazon Simple Storage Service (S3) zo'n vier uur lang onbereikbaar.
Deze dienst biedt websites en webdiensten online opslagruimte. In een verklaring stelt Amazon dat een geautoriseerde medewerker wat servers wilde verwijderen voor één van de S3-subsystemen die voor het S3-facturatieproces wordt gebruikt. "Helaas werd één van de waardes van het commando verkeerd ingevoerd en werd een groter aantal servers dan bedoeld verwijderd", aldus de verklaring.
De onbedoeld verwijderde servers werden gebruikt om twee andere S3-subsystemen te ondersteunen. Eén van deze subsystemen, het index-subsysteem, wordt gebruikt voor het beheren van de metadata en locatiegegevens van alle S3-objecten in de betreffende Amerikaanse regio. Het tweede systeem wordt gebruikt voor het toekennen van nieuwe cloudopslag.
De invoerfout zorgde ervoor dat beide subsystemen werden herstart, waardoor S3 geen verdere verzoeken kon verwerken. Dit had weer gevolgen voor andere Amazon-diensten die van S3 afhankelijk zijn. Vanwege het incident gaat Amazon nu verschillende aanpassingen doorvoeren die ervoor moeten zorgen dat S3-subsystemen sneller zijn te herstellen. Daarnaast zal het niet meer mogelijk voor medewekers zijn om in één keer zoveel servers te verwijderen.
Deze posting is gelocked. Reageren is niet meer mogelijk.