GNU/Linux >> Tutoriels Linux >  >> Linux

Niveaux et types de raid expliqués :avantages et inconvénients

Qu'est-ce que RAID ?

RAID (matrice redondante de disques indépendants) est une configuration composée de plusieurs disques pour le stockage des données. Ils sont reliés entre eux pour éviter la perte de données et/ou accélérer les performances. Le fait d'avoir plusieurs disques permet l'utilisation de diverses techniques telles que la disk striping , mise en miroir de disque , et parité .

Dans cet article, découvrez les types de RAID, leurs avantages et inconvénients, et leurs cas d'utilisation .

Niveaux et types de RAID

Les niveaux RAID sont regroupés dans les catégories suivantes :

  • Niveaux RAID standards
  • Niveaux RAID non standard
  • Niveaux RAID imbriqués/hybrides

De plus, vous pouvez choisir comment implémenter RAID sur votre système. Par conséquent, vous pouvez choisir entre RAID matériel, RAID logiciel et RAID micrologiciel.

La liste suivante explique les niveaux RAID standard (0, 1, 2, 3, 4, 5, 6) et les options populaires non standard et hybrides (RAID 10).

RAID 0 :entrelacement

RAID 0, également connu sous le nom d'ensemble par bandes ou de volume par bandes, nécessite un minimum de deux disques. Les disques sont fusionnés en un seul grand volume où les données sont stockées uniformément sur le nombre de disques de la matrice.

Ce processus s'appelle l'entrelacement de disque et implique de diviser les données en blocs et de les écrire simultanément/séquentiellement sur plusieurs disques. La configuration des disques entrelacés en tant que partition unique augmente les performances puisque plusieurs disques effectuent des opérations de lecture et d'écriture simultanément. Par conséquent, RAID 0 est généralement mis en œuvre pour améliorer la vitesse et l'efficacité.

Il est important de noter que si une matrice se compose de disques de différentes tailles, chacun sera limité à la plus petite taille de disque dans la configuration. Cela signifie qu'une matrice composée de deux disques, l'un de 320 Go et l'autre de 120 Go, a en fait une capacité de 2 x 120 Go (ou 240 Go au total).

Certaines implémentations vous permettent d'utiliser les 200 Go restants pour différentes utilisations. De plus, les développeurs peuvent implémenter plusieurs contrôleurs (ou même un par disque) pour améliorer les performances.

RAID 0 est le type de configuration de disque redondant le plus abordable et est relativement facile à configurer. Pourtant, il n'inclut aucune redondance, tolérance aux pannes ou parti dans sa composition. Par conséquent, des problèmes sur l'un des disques de la matrice peuvent entraîner une perte totale de données. C'est pourquoi il ne doit être utilisé que pour le stockage non critique, comme les fichiers temporaires sauvegardés ailleurs.

Avantages du RAID 0

  • Economique et simple à mettre en œuvre
  • Amélioration des performances de lecture et d'écriture.
  • Pas de frais généraux (utilisation totale de la capacité).

Inconvénients du RAID 0

  • Ne fournit pas de tolérance aux pannes ni de redondance.

Quand Raid 0 doit être utilisé

RAID 0 est utilisé lorsque les performances sont une priorité et que la fiabilité ne l'est pas. Si vous souhaitez utiliser vos disques au maximum et ne craignez pas de perdre des données, optez pour RAID 0.

D'autre part, une telle configuration ne doit pas nécessairement être peu fiable. Vous pouvez configurer la répartition des disques sur votre système avec une autre matrice RAID qui assure la protection et la redondance des données.

RAID 1 :Mise en miroir

RAID 1 est une matrice composée d'au moins deux disques sur lesquels les mêmes données sont stockées pour assurer la redondance. L'utilisation la plus courante de RAID 1 consiste à configurer une paire en miroir composée de deux disques dans lesquels le contenu du premier disque est mis en miroir sur le second. C'est pourquoi une telle configuration est également appelée mise en miroir.

Contrairement au RAID 0, où l'accent est mis uniquement sur la vitesse et les performances, l'objectif principal du RAID 1 est de fournir une redondance. Il élimine la possibilité de perte de données et de temps d'arrêt en remplaçant un disque défaillant par sa réplique.

Dans une telle configuration, le volume de matrice est aussi grand que le plus petit disque et fonctionne tant qu'un disque est opérationnel. Outre la fiabilité, la mise en miroir améliore les performances de lecture car une demande peut être traitée par n'importe quel lecteur de la baie. En revanche, les performances en écriture restent les mêmes qu'avec un disque et sont égales au disque le plus lent de la configuration.

Avantages du RAID 1

  • Amélioration des performances de lecture.
  • Fournit la redondance et la tolérance aux pannes.
  • Simple à configurer et facile à utiliser.

Inconvénients du RAID 1

  • N'utilise que la moitié de la capacité de stockage.
  • Plus cher (nécessite deux fois plus de pilotes).
  • Nécessite d'éteindre votre ordinateur pour remplacer le disque défectueux.

Quand Raid 1 doit être utilisé

RAID 1 est utilisé pour le stockage stratégique nécessitant un risque minimal de perte de données. Les systèmes de comptabilité optent souvent pour RAID 1 car ils traitent des données critiques et nécessitent une grande fiabilité.

Il convient également aux serveurs plus petits avec seulement deux disques, ainsi que si vous recherchez une configuration simple que vous pouvez facilement configurer (même à la maison).

Raid 2 :entrelacement au niveau du bit avec parité Hamming-Code dédiée

RAID 2 est rarement utilisé dans la pratique aujourd'hui. Il combine la segmentation au niveau du bit avec la vérification des erreurs et la correction des informations. Cette implémentation RAID nécessite deux groupes de disques - un pour écrire les données et un autre pour écrire les codes de correction d'erreurs. RAID 2 nécessite également un contrôleur spécial pour la rotation synchronisée de tous les disques.

Au lieu de blocs de données, RAID 2 répartit les données au niveau du bit sur plusieurs disques. De plus, il utilise la correction d'erreur de bourdonnement (ECC) et stocke ces informations sur le disque de redondance.

Le tableau calcule la correction du code d'erreur à la volée. Lors de l'écriture des données, il les supprime sur le disque de données et écrit le code sur le disque de redondance. D'autre part, lors de la lecture des données du disque, il lit également à partir du disque de redondance pour vérifier les données et apporter des corrections si nécessaire.

Avantages du RAID 2

  • Fiabilité.
  • La possibilité de corriger les informations stockées.

Inconvénients du RAID 2

  • Cher.
  • Difficile à mettre en œuvre.
  • Nécessite des disques entiers pour ECC.

Quand Raid 2 doit être utilisé

Le RAID 2 n'est pas une pratique courante aujourd'hui car la plupart de ses fonctionnalités sont désormais disponibles sur les disques durs modernes. En raison de son coût et de ses exigences de mise en œuvre, ce niveau RAID n'est jamais devenu populaire parmi les développeurs.

Raid 3 :entrelacement au niveau du bit avec parité dédiée

Comme RAID 2, RAID 3 est rarement utilisé dans la pratique. Cette implémentation RAID utilise une répartition au niveau du bit et un disque de parité dédié. Pour cette raison, il nécessite au moins trois disques, dont deux sont utilisés pour stocker les bandes de données et un est utilisé pour la parité.

Pour permettre la rotation synchronisée, RAID 3 a également besoin d'un contrôleur spécial. En raison de sa configuration et de la rotation synchronisée des disques, il atteint de meilleurs taux de performances avec des opérations séquentielles qu'avec des opérations de lecture/écriture aléatoires.

Avantages du RAID 3

  • Bon débit lors du transfert de grandes quantités de données
  • Haute efficacité avec des opérations séquentielles.
  • Résilience aux pannes de disque.

Inconvénients du RAID 3

  • Ne convient pas au transfert de petits fichiers.
  • Complexe à mettre en œuvre.
  • Difficile à configurer en tant que RAID logiciel.

Quand Raid 3 doit être utilisé

RAID 3 n'est pas couramment utilisé aujourd'hui. Ses fonctionnalités sont avantageuses pour un nombre limité de cas d'utilisation nécessitant des taux de transfert élevés pour de longues lectures et écritures séquentielles (telles que le montage et la production vidéo).

Raid 4 :répartition au niveau du bloc avec parité dédiée

RAID 4 est un autre niveau RAID standard impopulaire. Il consiste en une répartition des données au niveau des blocs sur deux diss indépendants ou plus et un disque de parité dédié.

La mise en œuvre nécessite au moins trois disques :deux pour le stockage des bandes de données et un dédié au stockage de la parité et à la redondance. Comme chaque disque est indépendant et qu'il n'y a pas de rotation synchronisée, il n'y a pas besoin de contrôleur.

La configuration RAID 4 est sujette aux goulots d'étranglement lors du stockage des bits de parité pour chaque bloc de données sur un seul disque. De tels goulots d'étranglement du système ont un impact important sur les performances du système.

Avantages du RAID 4

  • Opérations de lecture rapide.
  • Faible surcharge de stockage.
  • Requêtes d'E/S simultanées.

Inconvénients du RAID 4

  • Goulets d'étranglement qui ont un impact important sur les performances globales
  • Opérations d'écriture lentes.
  • La redondance est perdue si le disque de parité tombe en panne.

Quand Raid 4 doit être utilisé

Compte tenu de sa configuration, RAID 4 fonctionne mieux avec les cas d'utilisation nécessitant des processus de lecture et d'écriture séquentiels de données de fichiers volumineux. Pourtant, tout comme avec RAID 3, dans la plupart des solutions, RAID 4 a été remplacé par RAID 5.

Raid 5 :Striping avec parité

RAID 5 est considéré comme l'implémentation RAID la plus sécurisée et la plus courante. Il combine la répartition et la parité pour fournir une configuration rapide et fiable. Une telle configuration donne à l'utilisateur une facilité d'utilisation du stockage comme avec RAID 1 et l'efficacité des performances de RAID 0.

Ce niveau RAID se compose d'au moins trois disques durs (et au plus, 16). Les données sont divisées en bandes de données et réparties sur différents disques de la matrice. Cela permet des taux de performances élevés grâce aux transactions de données à lecture rapide qui peuvent être effectuées simultanément par différents disques de la baie.

Les bits de parité sont répartis uniformément sur tous les disques après que chaque séquence de données a été enregistrée. Cette fonctionnalité garantit que vous avez toujours accès aux données des bits de parité en cas de panne d'un disque. Par conséquent, RAID 5 offre une redondance via des bits de parité au lieu de la mise en miroir.

Avantages du RAID 5

  • Hautes performances et capacité.
  • Vitesse de lecture rapide et fiable.
  • Tolère les pannes d'un seul disque.

Inconvénients du RAID 5

  • Délai de reconstruction plus long.
  • Utilise la moitié de la capacité de stockage (en raison de la parité).
  • Si plusieurs disques tombent en panne, les données sont perdues.
  • Plus complexe à mettre en œuvre.

Quand Raid 5 doit être utilisé

RAID 5 est souvent utilisé pour les serveurs de fichiers et d'applications en raison de sa grande efficacité et de son stockage optimisé. De plus, il s'agit de la meilleure solution rentable si l'accès continu aux données est une priorité et/ou si vous avez besoin d'installer un système d'exploitation sur la baie.

Raid 6 :Striping avec double parité

RAID 6 est une matrice similaire à RAID 5 avec en plus sa fonction de double parité. Pour cette raison, il est également appelé RAID à double parité.

Cette configuration nécessite un minimum de quatre disques. La configuration ressemble à RAID 5 mais comprend deux blocs de parité supplémentaires répartis sur le disque. Par conséquent, il utilise une répartition au niveau des blocs pour répartir les données sur le tableau et stocke deux blocs de parité pour chaque bloc de données.

La répartition au niveau des blocs avec deux blocs de parité permet deux pannes de disque avant la perte de données. Cela signifie qu'en cas de défaillance de deux disques, RAID peut toujours reconstruire les données requises.

Ses performances dépendent de la manière dont la matrice est implémentée, ainsi que du nombre total de disques. Les opérations d'écriture sont plus lentes par rapport aux autres configurations en raison de sa fonction de double parité.

Avantages du RAID 6

  • Haute tolérance aux pannes et aux pannes de disque.
  • Efficacité du stockage (lorsque plus de quatre disques sont utilisés).
  • Opérations de lecture rapide.

Inconvénients du RAID 6

  • Le temps de reconstruction peut prendre jusqu'à 24 heures.
  • Performances d'écriture lentes
  • Complexe à mettre en œuvre.
  • Plus cher.

Quand Raid 6 doit être utilisé

RAID 6 est une bonne solution pour les applications critiques où la perte de données ne peut être tolérée. Par conséquent, il est souvent utilisé pour la gestion des données dans les secteurs de la défense, de la santé et de la banque.

Raid 10 :Mise en miroir avec striping

RAID 10 fait partie d'un groupe appelé RAID imbriqué ou hybride, ce qui signifie qu'il s'agit d'une combinaison de deux niveaux RAID différents. Dans le cas de RAID 10, la baie combine la mise en miroir de niveau 1 et la répartition de niveau 0. Cette matrice RAID est également connue sous le nom de RAID 1+0.

RAID 10 utilise la mise en miroir logique pour écrire les mêmes données sur deux disques ou plus afin de fournir une redondance. Si un disque tombe en panne, il existe une image miroir des données stockées sur un autre disque. De plus, la baie utilise une répartition au niveau des blocs pour distribuer des blocs de données sur différents disques. Cela améliore les performances et la vitesse de lecture et d'écriture car les données sont accessibles simultanément à partir de plusieurs disques.

Pour implémenter une telle configuration, la matrice nécessite au moins quatre disques, ainsi qu'un contrôleur de disque.

Avantages du RAID 10

  • Hautes performances.
  • Haute tolérance aux pannes.
  • Opérations de lecture et d'écriture rapides.
  • Temps de reconstruction rapide.

Inconvénients du RAID 10

  • Évolutivité limitée.
  • Coûteux (par rapport aux autres niveaux RAID).
  • Utilise la moitié de la capacité de l'espace disque.
  • Plus compliqué à configurer.

Quand Raid 10 doit être utilisé

RAID 10 est souvent utilisé dans les cas d'utilisation qui nécessitent le stockage de gros volumes de données, des temps de lecture et d'écriture rapides et une tolérance élevée aux pannes. Par conséquent, ce niveau RAID est souvent mis en œuvre pour les serveurs de messagerie, les serveurs d'hébergement Web et les bases de données.

RAID non standard

Les niveaux RAID mentionnés ci-dessus sont considérés comme des implémentations RAID standard ou couramment utilisées. Cependant, il existe une myriade de façons de configurer des ensembles redondants de disques indépendants.

En conséquence, de nombreux projets et entreprises open source ont créé leurs propres configurations pour répondre à leurs besoins. Par conséquent, il existe de nombreuses implémentations RAID non standard, telles que :

  • RAID-DP
  • Linux MD RAID 10
  • RAID-Z
  • Extension de disque
  • RAID désagrégé

RAID imbriqué (hybride)

Vous pouvez combiner deux ou plusieurs niveaux RAID standard pour garantir de meilleures performances et une meilleure redondance. De telles combinaisons sont appelées niveaux RAID imbriqués (ou hybrides).

Les implémentations RAID hybrides sont nommées d'après les niveaux RAID qu'elles intègrent. Dans la plupart des cas, ils incluent deux nombres où leur ordre représente le schéma de superposition.

Les niveaux RAID hybrides populaires incluent :

  • RAID 01 (striping and mirroring ; également appelé "mirror of stripes")
  • RAID 03 (entrelacement au niveau de l'octet et parité dédiée)
  • RAID 10 (mise en miroir de disque et répartition directe au niveau des blocs)
  • RAID 50 (parité distribuée et répartition directe au niveau du bloc)
  • RAID 60 (double parité et répartition directe au niveau du bloc)
  • RAID 100 (une bande de RAID 10)

Types d'implémentation RAID

Il existe trois façons d'utiliser le RAID, qui diffèrent par l'endroit où le traitement a lieu.

RAID matériel

Lors de l'installation du matériel configuration, vous insérez une carte contrôleur RAID dans un slot PCI-Express rapide de la carte mère et vous la connectez aux disques. Des boîtiers de disques RAID externes avec une carte contrôleur intégrée sont également disponibles.

RAID logiciel

Pour le logiciel configuration, vous connectez les disques directement à l'ordinateur, sans utiliser de contrôleur RAID. Dans ce cas, vous gérez les disques via un logiciel utilitaire sur le système d'exploitation.

RAID basé sur le micrologiciel/pilote

Les RAID basés sur le micrologiciel (également appelés RAID basés sur les pilotes) sont des systèmes RAID souvent stockés directement sur la carte mère. Toutes ses opérations sont effectuées par le processeur de l'ordinateur, et non par un processeur dédié.


Linux
  1. Commandes tête et queue sous Linux expliquées avec des exemples

  2. Liens physiques et liens souples sous Linux expliqués

  3. Linux - Comprendre les autorisations Unix et les types de fichiers ?

  4. Pipes et redirection sous Linux - expliqués !

  5. Avantages du fichier cat'ing et de la tuyauterie vers grep

Types de base de données expliqués

Explication des types d'enregistrement DNS

Différence entre apt et apt-get expliquée

Qu'est-ce qu'un hyperviseur et quels sont ses types

Cron Jobs et Crontab sur Linux expliqués

Présentation des types de bases de données distribuées et de la sécurité