image

Aantal defecte harde schijven verdrievoudigd

dinsdag 21 juni 2011, 12:31 door Redactie, 17 reacties

Het aantal defecte harde schijven is in twee jaar tijd verdrievoudigd, waarbij RAID-systemen geen onfeilbare oplossing zijn. "Veel bedrijven houden er geen rekening mee dat meerdere harde schijven tegelijkertijd kunnen uitvallen en laten na om op zijn minst de belangrijkste data te backuppen”, zegt Robbert Brans van Attingo. Het bedrijf zag het aantal data recovery gevallen van 2009 tot 2010 verdrievoudigen.

Hierbij waren vrijwel altijd harde schijven met een relatief grote opslagcapaciteit betrokken. Ging het in 2009 nog gemiddeld om een capaciteit van één terabyte, in 2010 was dat al opgelopen naar drie terabyte. Ook het aantal defecte harde schijven in RAID-systemen is volgens het data recovery bedrijf "indrukwekkend".

Fabels
"Het argument dat meerdere harde schijven niet tegelijkertijd zullen uitvallen, moeten we naar het land der fabels verwijzen”, stelt Brans. Er
zijn tal van oorzaken waarom er juist meer schijven op hetzelfde moment uit kunnen vallen. “Veel voorkomende spanningspieken kunnen er alleen al voor zorgen dat een systeem crasht. Daarnaast komen productiefouten, oververhitting of schokken tijdens het transport vaak voor.”

Een andere boosdoener kan de ingebouwde RAID-controller firmware zijn. "We constateren een toename van de storingen als gevolg van defecte of slecht geprogrammeerde controllersoftware”, aldus Brans. “Veel bedrijven geloven dat er met hun data, na het investeren in een dure RAID-oplossing, niets kan gebeuren. Dat is een vergissing die bedrijven fataal kan worden”, stelt de datahersteller.

Virtualisatie
In het geval van gevirtualiseerde systemen, waarbij diverse toepassingen op dezelfde hardware draaien, was er sprake van een verdubbeling. "Bedrijven komen enorm onder druk te staan wanneer daarbij ook maar iets misgaat en niemand binnen de organisatie meer zijn werk kan doen”, gaat Brans verder.

Reacties (17)
21-06-2011, 12:57 door Anoniem
Ik heb regelmatig gezien dat schijven uit dezelfde productiebatch rond dezelfde tijd uitvielen. Sinds die tijd worden bij voorkeur schijven uit verschillende batches gebruikt. En eventueel zelfs van verschillende fabrikanten. Al levert dat soms problemen op als je echt de totale schijf wilt gebruiken. Verschillende fabrikanten hebben nog steeds een iets afwijkende gedachte over wat 1TB diskruimte echt is.

Peter
21-06-2011, 13:04 door SirDice
Door Redactie: Hierbij waren vrijwel altijd harde schijven met een relatief grote opslagcapaciteit betrokken. Ging het in 2009 nog gemiddeld om een capaciteit van één terabyte, in 2010 was dat al opgelopen naar drie terabyte.
Die grote harde schijven zijn best handig maar als ze stuk gaan ben je wel ineens heel veel data kwijt.

Ook het aantal defecte harde schijven in RAID-systemen is volgens het data recovery bedrijf "indrukwekkend".
RAID is nooit een alternatief voor een goede backup strategie.
21-06-2011, 13:20 door Anoniem
Door Anoniem: Al levert dat soms problemen op als je echt de totale schijf wilt gebruiken. Verschillende fabrikanten hebben nog steeds een iets afwijkende gedachte over wat 1TB diskruimte echt is.
Voor waarden van "iets" gelijk aan 2-300 megabyte, en dat was nog maar op een 150G disk...

(En inderdaad, de andere helft van 't RAID1 paar ging 2 weken later titsup.)
21-06-2011, 14:00 door Preddie
Virutaliseren moet je niet willen op productie systemen, this handig voor testdoeleinden maar het kan je nachtmerrie worden in je productie omgeving. Als je het mij vraagt moet je het daarom niet doen, een gewoon systeem uitgerust met RAID of ZFS en daar dagelijks een back-up van maken die op locatie wordt bewaard.
21-06-2011, 14:17 door Anoniem
Door Predjuh: Virutaliseren moet je niet willen op productie systemen, this handig voor testdoeleinden maar het kan je nachtmerrie worden in je productie omgeving. Als je het mij vraagt moet je het daarom niet doen, een gewoon systeem uitgerust met RAID of ZFS en daar dagelijks een back-up van maken die op locatie wordt bewaard.


Daarom is juist heel de wereld productie omgevingen aan het virtualiseren?
Met goede bare-metal virtualisatie tools en een fatsoenlijke SAN ben je zoveel flexibeler dan een conventioneel systeem, en kun je veel sneller een disaster recovery uitvoeren.

Maar dan nog blijft:
RAID=Geen Backup

Naast je Raid-array's is geen goede backup strategie een life-saver.
21-06-2011, 14:49 door Mysterio
Door Predjuh: Virutaliseren moet je niet willen op productie systemen, this handig voor testdoeleinden maar het kan je nachtmerrie worden in je productie omgeving. Als je het mij vraagt moet je het daarom niet doen, een gewoon systeem uitgerust met RAID of ZFS en daar dagelijks een back-up van maken die op locatie wordt bewaard.

Oh, ik heb juist heel positieve ervaringen met virtualisatie. Tot een anderhalf jaar terug hadden we de rekken vol met allerhande troep waarvan de helft al tijden aan vervanging toe was. Nu is zo veel mogelijk gevirtualiseerd en hebben we nog maar één rek met een paar servers en de backup units. Mocht er iets mis gaan dan neemt de andere server het over... Nee, dit is echt ideaal!

En de backups draaien we nog steeds. Geen zorgen.
21-06-2011, 15:09 door Anoniem
Ik had een RAID-5 server, persoonlijk gebruik
Bezig met prijzen bijeen te rapen, materiaal op te zoeken en zo voor een andere fileserver om daar de data op te zetten als backup.
Net dan natuurlijk ... crash
2 schijven ... op exact dezelfde -seconde-

Raid != backup
21-06-2011, 15:19 door Preddie
Door Mysterio:
Door Predjuh: Virutaliseren moet je niet willen op productie systemen, this handig voor testdoeleinden maar het kan je nachtmerrie worden in je productie omgeving. Als je het mij vraagt moet je het daarom niet doen, een gewoon systeem uitgerust met RAID of ZFS en daar dagelijks een back-up van maken die op locatie wordt bewaard.

Oh, ik heb juist heel positieve ervaringen met virtualisatie. Tot een anderhalf jaar terug hadden we de rekken vol met allerhande troep waarvan de helft al tijden aan vervanging toe was. Nu is zo veel mogelijk gevirtualiseerd en hebben we nog maar één rek met een paar servers en de backup units. Mocht er iets mis gaan dan neemt de andere server het over... Nee, dit is echt ideaal!

En de backups draaien we nog steeds. Geen zorgen.

I know, dat zeggen veel mensen. Tot er wat fout gaat ! let op mijn woorden, ik spreek namelijk niet vanuit ideologie maar uit ervaring. Vroeger ging er 1 server plat, nu gaan er 20 tegelijk..... jamaar jamaar hoor je dan Vmotion enz.enz. bla bla, Dan moet ik dus alles dubbel gaan uitrusten om het redundant te maken (moet het nog wel werken, doet het namelijk niet altijd) en als je alles dubbel moet doen ben je het hele kosten argument kwijt waardoor uiteindelijk je hele virtualisatie weer duurder uitkomt.


Door Anoniem:
Door Predjuh: Virutaliseren moet je niet willen op productie systemen, this handig voor testdoeleinden maar het kan je nachtmerrie worden in je productie omgeving. Als je het mij vraagt moet je het daarom niet doen, een gewoon systeem uitgerust met RAID of ZFS en daar dagelijks een back-up van maken die op locatie wordt bewaard.


Daarom is juist heel de wereld productie omgevingen aan het virtualiseren?
Met goede bare-metal virtualisatie tools en een fatsoenlijke SAN ben je zoveel flexibeler dan een conventioneel systeem, en kun je veel sneller een disaster recovery uitvoeren.

Maar dan nog blijft:
RAID=Geen Backup

Naast je Raid-array's is geen goede backup strategie een life-saver.

Flexibeler zeker, maar een productie omgeving hoeft niet zo flexibel te zijn, je test en acceptatie omgeving wel.

Het feit dat je sneller recovery uit kan voeren is niet waar, als jou ESX bak eruit ligt heb ik sneller mijn server weer online dan jij je ESX, daar ben ik 100% zeker van. Alleen bij mij ligt er 1 bak uit en bij jou 20. Als je we spreker over een viruele machine dan heb je die waarschijnlijk eerder weer online dan mijn server maar dat is dus helemaal afhankelijk waar het fout gaat. Maar op de fysieke laag ben ik er zeker van dat ik sneller ben ;)
21-06-2011, 16:53 door Mysterio
Door Predjuh: I know, dat zeggen veel mensen. Tot er wat fout gaat ! let op mijn woorden, ik spreek namelijk niet vanuit ideologie maar uit ervaring. Vroeger ging er 1 server plat, nu gaan er 20 tegelijk..... jamaar jamaar hoor je dan Vmotion enz.enz. bla bla, Dan moet ik dus alles dubbel gaan uitrusten om het redundant te maken (moet het nog wel werken, doet het namelijk niet altijd) en als je alles dubbel moet doen ben je het hele kosten argument kwijt waardoor uiteindelijk je hele virtualisatie weer duurder uitkomt.
Hmmm.... Ja maar Vmotion! ;) Je hebt gelijk, maar in ons geval is 'alles dubbel uitrusten' goedkoper dan de crappy servers in leven houden en support contracten vernieuwen.

Het is helemaal situatie afhankelijk. Wij hebben het gebruikt om de oude troep op te ruimen of onder te brengen in een donker hoekje van de virtuele wereld. En onze mooie servers draaien nu beter. Laatst hadden we een kapot moederbord op zo'n ondergestoft ding. Geen hond die zo'n moederbord had liggen en uiteindelijk hebben we het met een houtje touwtje oplossing weer up gekregen. Nu zijn we weer up to date en helemaal voorzien van strakke contracten.

En... qua stroomverbruik en koeling is het echt geniaal!
21-06-2011, 20:07 door ej__
Overigens is niet de backup belangrijk maar de restore. Doe restore testen. Dan pas weet je zeker(der) dat je veilig bent.
En inderdaad, ik ben het helemaal met Mysterio eens voor wat betreft virtualisatie.

Voor mij ligt de uitzondering voor virtualisatie op servers met vertrouwelijke data (want breek door de virtualisatie en je hebt bal) en firewalls (de ultieme vorm van vertrouwelijke data, toch?) om dezelfde reden.
21-06-2011, 22:14 door Above
Bij mij ook gebeurd met een IBM server X226 en een Poweredge 2900 van Dell.
Van allebei de servers zijn een keer de harde schijven uitgevallen omdat de controller een opdonder kreeg(spanningspiek).
Vandaag had de server ineens een herstart omdat de voltage te laag was van het net. 200 volt ineens volgens APC.
Gelukkig weer snel online maar je hart gaat op zo een moment heeeeeel snel kloppen van angst :-)
In de toekomst wil ik de back-up oplossing via cloud hebben.
21-06-2011, 22:23 door Anoniem
Veel bedrijven nemen echt ongelofelijke risico's. Of ze backuppen niet alle belangrijke data, of ze checken niet of de data die ze backuppen wel terug te zetten is. Tsja...
Ik werk bij een bedrijf waar een dergelijk 'ongelukje' gebeurde.
Pas daarna werd het maken van goede backups (volgens een plan, en niet zomaar lukraak) bij ons serieus opgepakt!
Er is toen zelfs een compleet "disaster" plan opgesteld.

Dat bedrijf van Robbert Brans, Attingo Datarecovery, is overigens een heel goed en betrouwbaar adres voor als het eens echt mis gaat. En ik spreek uit ervaring...
http://www.attingo-datarecovery.nl
22-06-2011, 09:55 door Anoniem
Flexibeler zeker, maar een productie omgeving hoeft niet zo flexibel te zijn, je test en acceptatie omgeving wel.

Het feit dat je sneller recovery uit kan voeren is niet waar, als jou ESX bak eruit ligt heb ik sneller mijn server weer online dan jij je ESX, daar ben ik 100% zeker van. Alleen bij mij ligt er 1 bak uit en bij jou 20. Als je we spreker over een viruele machine dan heb je die waarschijnlijk eerder weer online dan mijn server maar dat is dus helemaal afhankelijk waar het fout gaat. Maar op de fysieke laag ben ik er zeker van dat ik sneller ben ;)


We hebben hier 3 Vsphere hosts hangen in een clusters, dus als een van die host servers uitvalt worden de VM's gewoon gemigreerd naar een andere host. Ik zie het probleem niet.
Dit is uitvoerig getest voordat we Vsphere implementeerde, en ik durf best te stellen dat het migreren van een VM naar een andere host veel sneller gebeurd dan het herstellen van jouw fysieke server.
22-06-2011, 12:26 door Anoniem
Als raid geen backup is, wat is het dan?
22-06-2011, 14:49 door Anoniem
Door Anoniem: Als raid geen backup is, wat is het dan?

Kort stukje leesvoer:

http://serverfault.com/questions/2888/why-is-raid-not-a-backup
22-06-2011, 16:39 door Anoniem
RAID is inderdaad echt geen backup, heb het zelf een keer gehad dat de server uitdonderde (Stroomstoring en de UPS werkte blijktbaar niet) terwijl hij bezig was met filesystem opdrachten.
Resultaat : Filesystem helemaal naar zijn grootje, en dan heb je een RAID opstelling, 3 keer raden wat er gebeurde, alles werd gemirrored naar de andere schijven waar de data nog wel goed was! Poging om het filesystem te herstellen mislukte, gelukkig hadden we nog alles nog op tape/ andere servers anders waren we meer dan 3-4 TB aan data kwijt.
22-06-2011, 16:49 door SirDice
Door Anoniem: Als raid geen backup is, wat is het dan?
Kort antwoord: redundante hardware beschermt je data niet tegen domme acties van gebruikers.
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.