RAID pour ceux qui l'évitent

Tout le matériel finit par tomber en panne. C'est l'un des effets secondaires douloureux de l'entropie dans notre univers. Pour la plupart des types de matériel utilisés dans les infrastructures modernes, la perte d'un seul composant entraîne généralement un certain temps d'arrêt. Mis à part le temps nécessaire pour échanger quelque chose comme un mauvais processeur ou un mauvais bâton de RAM, les administrateurs système ou les utilisateurs voient rarement de nombreux effets néfastes à long terme. Mais à moins qu'un administrateur ne fasse particulièrement attention au stockage, la perte de données due à des pannes de disque peut avoir des conséquences immédiates et durables.

Prenons l'exemple de l'ordinateur d'un utilisateur :s'il stocke ses données localement sur un seul disque, ses données seront perdues en cas de panne inévitable du disque. Il en va de même, peu importe la qualité, la marque ou le type de lecteur. Bien sûr, il existe des équipes de récupération de données qui seraient heureuses de prendre de l'argent durement gagné en échange de la possibilité de ressusciter des bits de disques morts. Malheureusement, le coût devient rapidement exorbitant, et même ces spécialistes font défaut à un moment donné.

Les administrateurs ont un certain nombre d'options à leur disposition pour parer à une catastrophe imminente :RAID, sauvegardes, clusters de stockage en réseau, etc. Souvent, ces options sont utilisées conjointement pour fournir des couches de protection des données et de multiples opportunités pour arrêter un problème avant qu'il ne devienne trop en retard. Construire des baies de disques redondantes et extraire le stockage des disques uniques est le moyen le plus simple et le meilleur de supprimer ces points de défaillance uniques. L'objectif est d'éviter les nuits tardives et les longs week-ends de restauration à partir de sauvegardes (que, espérons-le, quelqu'un a faites) ou de payer les frais extrêmes aux sociétés de récupération.

Qu'est-ce que le RAID ?

Les baies redondantes de disques bon marché (RAID) sont l'une des technologies de stockage les plus utilisées et les plus efficaces qu'un administrateur système rencontrera. Être à l'aise avec ses implémentations les plus courantes est essentiel. Le RAID peut être proposé en tant que solution logicielle via un utilitaire de système d'exploitation tel que mdadm sous Linux, un contrôleur RAID matériel comme la gamme de cartes MegaRAID, ou même des chipsets qui offrent des capacités pseudo-RAID. Les contrôleurs matériels tels que ceux de la gamme MegaRAID ne doivent pas être confondus avec les adaptateurs de bus hôte (HBA), ils sont conçus pour un accès simple et direct aux disques. Les HBA existent comme un moyen de fournir une connectivité sans l'intelligence du contrôleur RAID et sont par conséquent beaucoup moins chers.

À un niveau élevé, le concept de RAID regroupe une collection de disques dans une matrice pour écrire des données sur eux. Selon la configuration, les données seront écrites de différentes manières, avec différentes quantités d'informations de parité pour aider à reconstruire les données en cas de panne de disque. Bien qu'il soit possible d'utiliser différents types, vitesses, tailles ou connexions pour les disques d'une matrice, il est préférable de les faire correspondre autant que possible. Les disques de tailles différentes finissent presque toujours par être réduits au plus petit dénominateur commun, et les disques de vitesses différentes doivent attendre le plus lent.

Cependant, de nombreux administrateurs préfèrent acheter des disques de différents fabricants pour éviter que de mauvais lots de disques ne provoquent des pannes simultanées entre les membres des baies.

Niveaux RAID

Étant donné que les configurations RAID sont nommées en niveaux, le schéma de numérotation implique une échelle linéaire de progression d'une configuration à une autre, même si de nombreux niveaux ne sont pas liés les uns aux autres. Chaque niveau RAID a des avantages et des inconvénients, et certains niveaux sont plus utiles que d'autres. Dans le monde réel, les niveaux les plus courants sont 0, 1, 5, 6, 10, 50 et 60. Les niveaux RAID 2, 3, 4 et quelques autres existent également mais sont propriétaires, obsolètes ou rarement utilisés. Cela peut sembler beaucoup, mais une fois décomposées, ces informations deviennent plus faciles à digérer.

RAID 0

La plupart des niveaux RAID correspondent à un certain cas d'utilisation. À partir de RAID 0, nous constatons qu'il est construit sans aucune redondance interne à l'esprit, car chaque disque fournit sa pleine capacité à la matrice en tant que stockage utilisable. Étant donné que les données sont divisées et écrites sur tous les disques en parallèle, nous voyons un avantage. Lorsque les lectures et les écritures sont effectuées sur une baie configurée de cette manière, elles peuvent être très rapides, car elles s'adaptent de manière linéaire au nombre de disques inclus dans la baie.

Techniquement, bien que vous puissiez créer un seul disque dans une matrice RAID 0, vous feriez vraiment cela avec au moins une paire de disques. Le principal inconvénient du RAID 0, en général, est que si un seul disque manque, l'ensemble de la matrice tombera en panne et les données seront perdues. Cette configuration n'est pas adaptée à une utilisation en production où les données ne résident pas sur un autre système facilement accessible. RAID 0 peut être une configuration parfaitement raisonnable pour un poste de travail d'utilisateur final qui a besoin de hautes performances, cependant, où ce poste de travail n'est pas le seul endroit où les données sont traitées.

RAID 1

RAID 1 a été conçu avec un objectif totalement différent de RAID 0. Au lieu de répartir les données sur un ensemble de disques pour la vitesse sans aucune protection, RAID 1 donne à un administrateur la possibilité de mettre en miroir les données sur deux disques ou plus pour la résilience. Ce niveau RAID le fait pour fournir une copie locale (ou des copies) des données pour aider à prévenir la défaillance d'un seul disque, et il utilise les données des disques sains pour reconstruire les données après avoir été remplacées.

Habituellement, les miroirs RAID 1 se composent d'une paire de disques, mais ils peuvent en contenir trois ou plus, selon le nombre de copies de blocs que l'administrateur doit avoir en ligne. Ce qu'il est important de souligner, c'est que ce n'est pas une sauvegarde. Ces données existent sous la forme d'une copie en direct du lecteur dans un système et ne fournissent pas les garanties d'un système de sauvegarde régulier. Ces miroirs sont des clones 1:1, donc les disques doivent avoir la même taille, sinon l'espace sera perdu pour accueillir le plus petit disque de l'ensemble.

Quel que soit le nombre de disques ajoutés à une matrice RAID 1, la capacité totale reste la même. Cette capacité correspond à la taille d'un seul disque dans la matrice (le plus petit, s'ils ne sont pas identiques), mais le nombre de copies de données augmente avec chaque disque supplémentaire sans augmentation de la capacité globale. Chaque disque est un autre clone des données, offrant une protection supplémentaire contre les pannes de disque individuelles.

Le nombre de disques pouvant être ajoutés à une baie est limité, en fonction du logiciel utilisé et/ou du contrôleur auquel ils sont connectés.

RAID 2 à 4

Les niveaux RAID 2, 3 et 4 sont obsolètes, propriétaires ou très rares. Il est peu probable que de nombreux administrateurs système s'exécutent sur des systèmes exécutant l'une de ces trois configurations, et dans des circonstances normales, celles-ci peuvent effectivement être ignorées. Si vous travaillez sur un système exécutant l'un de ces éléments, le mieux est de lire la documentation du fournisseur pour savoir comment le gérer au mieux.

RAID 5

Au-delà de l'utilisation de RAID 0 pour répartir les données sur une collection de disques sans protection, ou de l'utilisation de RAID 1 pour obtenir une certaine redondance mais en limitant la capacité, RAID 5 offre un excellent compromis avec l'écriture de données sur plusieurs disques tout en offrant un niveau de redondance à la matrice. . RAID 5 le fait en écrivant des informations de parité sur chaque disque afin qu'il puisse reconstruire les données à partir de n'importe quel disque.

Lors de l'utilisation de RAID 5, une nouvelle exigence entre en jeu, en ce sens que la matrice doit inclure au moins trois disques. La capacité est alors égale à la somme totale des disques, moins la taille de l'un d'entre eux. Par exemple, un RAID 5 avec sept disques de 2 To finit par faire 12 To (7 x 2 égale 14, et moins un disque égale 12).

Lorsque l'un de ces disques tombe en panne, un administrateur peut le remplacer et demander au système de reconstruire le remplacement avec les données du reste de la matrice, en utilisant les informations de parité mentionnées précédemment. Il y a deux principaux inconvénients à cette configuration. Tout d'abord, il y a un impact sur les performances d'écriture (il y a une surcharge dans l'écriture de tous ces bits supplémentaires d'informations de parité lors de l'écriture des données réelles). Deuxièmement, lors d'une reconstruction, la matrice est vulnérable à une perte totale si l'un des disques sains tombe également en panne. En fonction de la charge de travail de la machine, une reconstruction peut créer un pic soudain de l'activité de ces disques et finir par entraîner l'échec de l'un des disques sains. Cette préoccupation est la raison pour laquelle, actuellement, de nombreux administrateurs optent pour RAID 6.

RAID 6

Évolution naturelle du RAID 5, le RAID 6 reprend le même concept de base et étend le "disque unique" des informations de parité à une paire de disques. Bien que l'intégralité des disques individuels ne soit pas utilisée pour la parité, la capacité globale des disques est utilisée sur l'ensemble de la matrice, et RAID 6 utilise l'espace de deux disques pour contenir les bits de parité.

L'utilisation de l'espace d'un disque supplémentaire signifie par la suite que le nombre minimum de disques pour une matrice RAID 6 passe à quatre. Ce changement apparemment simple peut signifier un monde de bien lorsqu'il s'agit de reconstruire un disque défaillant tout en exécutant une baie. Vous pouvez être sûr qu'une panne supplémentaire ne signifiera pas une perte totale des données résidant localement sur la machine.

RAID imbriqué

Au-delà des niveaux 0, 1, 5 et 6, nous nous retrouvons avec l'idée d'emboîter les niveaux de RAID ensemble pour créer de nouvelles configurations qui offrent de nouvelles options de stockage. Les plus répandus et les plus bénéfiques sont 10, 50 et 60 ; chacun étant une combinaison de 1, 5 et 6 plus 0, respectivement.

RAID 10

Une combinaison de 1 et 0 peut donner l'impression que cela aurait dû être à nouveau RAID 5, mais la meilleure façon de penser à ces niveaux imbriqués est en deux dimensions. Pour RAID 10, nous en prenons plusieurs matrices RAID 1 et répartissez-les comme si ces matrices étaient des disques, créant ainsi une matrice RAID 0 à partir d'eux. En raison de ce facteur, RAID 10 nécessite au moins quatre disques :deux pour un miroir et une paire de ces miroirs. Ce que nous obtenons est une matrice avec une vitesse semblable à celle d'un RAID 0 mais qui bénéficie de la redondance interne d'un RAID 1. Une matrice RAID 10 échouerait uniquement lorsque l'une des matrices RAID 1 internes tombe en panne.

Dans chaque paire RAID 1 (ou plusieurs miroirs si un administrateur le souhaite), la récupération est possible lorsque les disques doivent être remplacés, de sorte qu'un ensemble complet de membres RAID 1 devrait échouer pour que le RAID 10 lui-même succombe à la perte de données . Les reconstructions sont également différentes. Dans RAID 5, les données doivent être lues à partir de tous les disques de la matrice pour calculer de nouveaux bits à partir de la parité précédemment écrite. RAID 10, puisqu'il utilise RAID 1, lit à partir du ou des clones du disque défaillant pour le reconstruire.

RAID 50

Comme RAID 10, RAID 50 nous donne la possibilité de créer une matrice rapide à partir de celles redondantes. Nous nous retrouvons avec un RAID 0 englobant un certain nombre de matrices RAID 5, similaire à la façon dont RAID 10 était un ensemble de matrices RAID 1. C'est là que nous commençons à voir beaucoup de disques entrer en scène, même pour les configurations les plus simples. Étant donné qu'un RAID 5 de base nécessite trois disques, un RAID 50 en nécessiterait au moins six au total, puisqu'il s'agit au minimum d'une paire de matrices RAID 5.

Encore une fois, similaire au RAID 10, cette option est le meilleur des deux mondes. RAID 50 nous donne une vitesse supplémentaire grâce à l'ajout de plusieurs disques ajoutés en parallèle, tout en nous donnant les informations de parité interne de la configuration RAID 5. Un RAID 50 peut supporter plusieurs disques défaillants, tant qu'ils ne se trouvent pas dans la même matrice RAID 5 imbriquée.

RAID 60

À ce stade, RAID 60 ne devrait pas surprendre, car il s'agit de la même extension logique de RAID 6 à 60 que RAID 5 à 50. Le principal avantage supplémentaire réside dans les gains de vitesse qui peuvent être obtenus, combinés à l'augmentation massive de la redondance fournie dans les multiples copies des informations de parité, et à la portée étroite des défaillances pour chaque baie imbriquée. Les matrices RAID 60 commencent à huit disques, puisque chaque RAID 6 en compte au moins quatre, en multiples d'au moins deux matrices.

RAID vs sauvegardes

L'un des dictons les plus couramment adoptés dans le domaine de l'administration système semble être :"le RAID n'est pas une sauvegarde". Pour les nouveaux administrateurs ou ceux qui ne passent pas beaucoup de temps à penser au stockage, ce fait peut ne pas être immédiatement évident. Cela peut même sembler antagoniste ou carrément faux.

Le problème vient du fait que la redondance intégrée aux configurations RAID est construite avec les mêmes objectifs en tête que les sauvegardes :Lutter contre la perte de données. La raison pour laquelle il est si important de parler de la différence n'est pas pour pinailler, mais pour nous rappeler que ces outils existent pour nous fournir des couches de protection, et qu'en les regroupant, nous nous rendons un mauvais service.

RAID existe pour fournir une copie immédiate et en direct des données pour aider une machine en marche comme une béquille lorsqu'elle se relève après avoir trébuché. D'autre part, les sauvegardes offrent l'opportunité de tester notre capacité à remettre une machine en état de marche ou à récupérer des données sans que la machine soit en marche. Les sauvegardes nous offrent d'autres avantages que RAID n'offre pas aussi bien, y compris la possibilité de pousser des copies à plusieurs endroits sur plusieurs types de supports et d'enregistrer plusieurs versions.

Le RAID et les sauvegardes remplissent des rôles différents, mais les deux sont importants et ne doivent pas être négligés.