Quelques raisons de ne pas utiliser le RAID en sauvegarde

On entend inévitablement parler de RAID quand il est question de sauvegarde, quitte à confondre redondance de panne et pérénnité des données. Cela nous ferait presque penser que le RAID est universellement reconnu comme la solution pour protéger des données. Le RAID qui permettrait de faciliter les sauvegardes en augmentant la disponibilité. On peut alors lire que selon la robustesse et la tolérance aux panne voulue, on peut choisir entre le RAID5 et le RAID6, ce dernier étant particulièrement recommandé pour un nombre important de disques. Cet article traite exclusivement de ces deux types de RAID qui sont parmis les plus utilisés dans le stockage.

Nous sommes très critiques concernant le RAID en environnement de sauvegarde pour différentes raisons. Notre expérience dans le domaine de la sauvegarde nous a appris que la simplicité paie toujours, et que le RAID peut cacher quelques surprises.

On trouve plus facilement sur internet des articles décrivant la configuration d'un RAID, que d'articles discutant du bien fondé de tels systèmes. Nous pensons que le RAID peut être totalement justifié dans certains cas, mais il ne peut pas se substituer à une sauvegarde. Aussi, il est intéressant de prendre conscience des points suivants.

Si vous ne connaissez pas le vocabulaire de base lié au RAID (grappe, niveaux de RAID, ...) nous vous suggérons de lire d'abord un article de vulgarisation.

 

  1. Le RAID5 fournit généralement des mauvaises performances en écritures aléatoires et concurrentes. Oui, vous atteindrez sans difficultés d'énormes débits en lisant de longues zones contigües de votre système de fichiers. En écritures séquentielles c'est déjà moins brillant. Et l'euphorie liée à ces bonnes performances laisse place à la dure réalité en environnement professionnel, quand plusieurs utilisateurs sollicitent le système de fichier en lectures-écritures simultanées à différent endroits du système de fichiers. Finalement les cas de figure où le RAID excelle (lecture de gros fichiers unitaires) sont loin d'être une généralité dans les entreprises.

  2. Le RAID5 rend les administrateurs système trop sûrs d'eux. Parce qu'ils achètent des contrôleurs hors de prix, ou mettent en place un logiciel éprouvé pour gérer le RAID (au hasard, mdadm), les administrateurs surestiment parfois la tolérance aux pannes d'une grappe de disques durs. En fait, quand un disque dur tombe en panne, ses congénères ont eux-aussi une forte probabilité de tomber aussi dans le temps nécessaire à le reconstruction. Et ces dernières années, le temps de reconstruction a beaucoup augmenté car la capacité des disques durs croit plus vite que leurs débits en écriture. De plus, quand une fausse manipulation a lieu sur un RAID, cela peut être un système de fichiers (vraiment) très volumineux qui est affecté.

  3. Le RAID5, c'est bien quand c'est bien fait. C'est à dire que les outils de monitoring doivent être parfaits pour rendre compte de l'état de santé de grappes en fonctionnement, et pour agir dans la journée le cas échéant. Or dans les datacenters, on peut entendre des alarmes matérielles sonner pendant très longtemps...

  4. On attend la panne avec un RAID5. Ce n'est pas vrai partout bien sûr, mais le RAID est trop souvent vendu comme une méthodologie où les disques durs doivent être changés quand ils défaillent. Or une vérité incontestable est que tous les disques durs de ce monde défailleront, pour peu que leur durée de fonctionnement soit suffisamment longue. Donc il est préférable de remplacer un disque avant la défaillance, plutôt qu'après. Et accessoirement, il vous faut un contrat de maintenance sur une très longue durée si un prestataire a implémenté un RAID chez vous car le risque de panne de plusieurs disques simultanés croît avec le temps. Dans tous les cas, il est préférable de renouveler le parc de disques durs avant d'être confronté à la panne, comme expliqué dans cet article de blog.

  5. RAID matériel, RAID logiciel, métadonnées ddf, métadonnées isms, taille du strip-size, taille du cache, batterie d'appoint sont autant de paramètres qui complexifient l'administration d'un système de stockage. Le RAID est un élément à gérer en plus du système de fichiers, dont la complexité peut déjà être grande. Dans le cas du RAID matériel, les entreprises oublient parfois de commander en double leur contrôleur RAID, et seraient donc incapables de faire face à une panne de ce composant électronique. A cet égard, le RAID logiciel est beaucoup plus interopérable.

  6. Parfois, on prend le RAID5 pour ce qu'il n'est pas. Le RAID n'annule pas le risque de perte de données. Le RAID n'est pas un dispositif de sauvegarde. Le RAID n'est pas un ultime boosteur de performances de tous types. Finalement, le RAID n'est pas la panacée universelle.

 

Après la lecture de ces points, si le RAID vous paraît toujours être une excellent solution, c'est qu'il a des chances de l'être après tout.