image

Scriptbug veroorzaakte langdurige Dropbox-storing

maandag 13 januari 2014, 11:53 door Redactie, 0 reacties

Een bug in een upgradescript van Dropbox heeft ervoor gezorgd dat de populaire opslagdienst zo'n twee dagen onbereikbaar was. Eind vrijdagmiddag zou er gepland onderhoud aan verschillende machines plaatsvinden. Het ging om een upgrade van het besturingssysteem.

Dropbox gebruikte een upgradescript dat controleert of er geen actieve data op de machines aanwezig is voordat het nieuwe besturingssysteem wordt geïnstalleerd. Een bug in het upgradescript zorgde ervoor dat er een aantal actieve machines opnieuw werd geïnstalleerd.

Databases

Er worden duizenden databases gebruikt om Dropbox te draaien. Elke database heeft een master en twee slave machines voor redundantie. De bug in het script had invloed op een aantal master-slave paren, waardoor de website offline ging. Volgens Dropbox liepen de bestanden van gebruikers geen gevaar. Aangezien de databases waar de problemen zich voordeden geen bestandsdata van gebruikers bevatten.

Om het probleem op te lossen besloot Dropbox een recovery via de back-ups uit te voeren. Binnen drie uur was de meeste functionaliteit terug, maar de omvang van sommige databases zorgde ervoor dat de kerndienst pas gisterenmiddag weer operationeel was. Om herhaling te voorkomen heeft Dropbox maatregelen genomen, zoals het beter controleren van de staat van de machines voor een upgrade en snellere disaster recovery.

Nog geen reacties
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.