GNU/Linux >> Tutoriels Linux >  >> Linux

Entretien ménager Linux :gestion des archives et des sauvegardes

Chaque administrateur système sait, ou devrait savoir, que l'exécution et la gestion des sauvegardes sont essentielles pour être administrateur système. Si vous avez lu 5 astuces de sauvegarde et de restauration Linux dans les tranchées, vous savez comment effectuer et gérer des sauvegardes. Mais la gestion de l'espace requis pour effectuer ces sauvegardes est un sujet très différent. Cela fait partie de l'entretien ménager de Linux que vous devez prendre en compte dans votre flux de travail quotidien.

Dans cet article, j'aborde des éléments critiques de la gestion des sauvegardes tels que l'emplacement, la conservation, l'élimination et la disposition, et l'automatisation. Votre environnement et vos politiques dicteront les solutions que vous implémenterez pour la gestion de l'espace de sauvegarde, mais ces directives et recommandations vous aideront si vous avez du mal à gérer une quantité croissante de données inactives stockées sur votre réseau.

Emplacement, emplacement, emplacement

Tout le monde a entendu le vieil adage immobilier qui stipule que l'emplacement est l'aspect le plus important d'une propriété. L'espace de stockage est comme la propriété immobilière à cet endroit est très important. Les trois valeurs d'emplacement sont répertoriées ci-dessous.

  • Disques haute vitesse :stockage de sauvegarde initial et à court terme
  • Stockage en réseau :lecteurs publics et espaces partagés
  • Stockage hors site et stockage dans le cloud :stockage à long terme

Disques haute vitesse

Le stockage sur disque à grande vitesse comprend le stockage connecté localement, les baies flash et le stockage SAN. C'est à cet emplacement que les sauvegardes atterrissent initialement, mais elles n'y sont pas stockées à long terme. Ces types de stockage sont beaucoup trop coûteux à utiliser pour le stockage de sauvegarde. Les données doivent être déplacées vers un stockage à moindre coût immédiatement après les sauvegardes.

Vous devez également séparer les sauvegardes des données de production. En d'autres termes, ne collectez pas de sauvegardes sur les mêmes disques que ceux où se trouvent des bases de données, des journaux de transactions ou d'autres services gourmands en écriture stockant des données.

Stockage en réseau

Le stockage en réseau est généralement destiné aux applications de données en cours d'utilisation telles que les lecteurs publics et les espaces partagés. Ces zones ne sont pas destinées aux sauvegardes ; les jeux de sauvegarde sont généralement trop volumineux pour être stockés dans des espaces publics. Les lecteurs publics et les espaces partagés doivent également être sauvegardés, ce qui est une autre raison pour ne pas stocker les jeux de sauvegarde dans ces zones.

Un stockage de sauvegarde séparé en réseau peut être provisionné pour stocker des données pour un accès et une utilisation à long terme. Dans la règle 3-2-1, il s'agirait de l'une des deux copies de données stockées sur des supports différents. Une fois que les données ont été transférées vers un stockage en réseau, elles peuvent être répliquées sur une baie distincte, un support d'archivage ou un type de stockage hors site.

[ Vous songez à une stratégie cloud ? Découvrez pourquoi les entreprises choisissent le cloud hybride ouvert. ]

Stockage hors site

Le stockage de données hors site est des données qui resteront inchangées et auxquelles les utilisateurs ou les administrateurs n'auront pas accès. Il est statique et est stocké à des fins de reprise après sinistre. Certains administrateurs sauvegardent à partir d'un stockage en réseau vers une forme de stockage sur disque portable pour la livraison et le stockage hors site.

Alternativement, les administrateurs peuvent transférer des données d'un stockage en réseau vers un stockage basé sur le cloud ou hébergé à des fins de reprise après sinistre.

Rétention

De tous les problèmes de gestion interne auxquels sont confrontés les administrateurs système, la conservation des données est la plus controversée et la plus laborieuse. La conservation des sauvegardes est toujours un excellent sujet de débat pour les administrateurs système. La rétention fait référence à la durée pendant laquelle vous conservez les sauvegardes en cas d'événement catastrophique ou en cas de nécessité d'une restauration complète. Bien que ces cas soient rares, vous avez toujours besoin d'une éventualité pour eux s'ils se produisent.

Mes suggestions sont les suivantes :

  • Données critiques :0 jour à 6 mois
  • Données utilisateur :7 à 30 jours
  • Données transactionnelles :3 jours
  • Données héritées :permanentes sur des disques non connectés

Les sauvegardes nécessitent beaucoup d'espace de stockage, et plus vous conservez les données longtemps, plus vous avez besoin d'espace. La rétention est bonne, mais en faire trop gaspille des ressources. Les données non consultées datant de plus de 30 jours doivent être archivées là où elles sont toujours accessibles si nécessaire. À un moment donné, vous devez vous sentir à l'aise pour jeter des données anciennes et obsolètes.

Élimination et disposition

Je ne sais pas pour vous, mais détruire des données, même avec la permission ou une directive de le faire, me met toujours un peu mal à l'aise. Le démontage des disques utilisés pour le stockage me donne l'impression d'être un gaspillage. Le déchiquetage des bandes est peut-être le pire de tous. Peut-être que je suis un thésauriseur dans l'âme, mais je ne peux pas m'en empêcher. Mon instinct me dit de protéger toutes les données. Cette obsession de conserver trop de données est presque aussi mauvaise que l'obsession de détruire des données.

L'élimination et la disposition ne sont pas les mêmes. Il y a une différence. Ils ont le même objectif final, qui est de supprimer les données, et éventuellement le matériel, de votre réseau.

L'élimination est la suppression des données et du matériel sur lequel elles résidaient sans tenir compte des conséquences éventuelles de cette élimination. C'est-à-dire que ce type de suppression n'implique pas nécessairement la suppression sécurisée des données ou du matériel. Parfois, les données ne sont pas du tout effacées, mais le matériel lui-même est jeté ou recyclé. Ce retrait imprudent peut entraîner des failles de sécurité et un impact sur l'environnement.

La disposition est la suppression responsable des données et du matériel. Il est généralement régi par une politique. Pour les données, cela signifie la destruction irréversible des données par des moyens qui les rendent impossibles à récupérer. Pour le matériel, la disposition fait référence au recyclage responsable, à la remise en service ou au retour au fabricant, peut-être dans le cadre d'un échange ou d'un programme de mise à niveau.

Automatisation

J'ai mis en place avec succès des systèmes de sauvegarde entièrement automatisés pour plusieurs clients. Mon automatisation consiste généralement en des sauvegardes automatisées, des jeux de sauvegarde automatisés déplacés vers un stockage plus permanent et un archivage automatisé des données auxquelles personne n'a accédé depuis plus de six mois.

Le "truc" pour automatiser les sauvegardes, ou tout ensemble complexe de tâches, est le timing. Vous devez attendre d'avoir terminé votre première tâche avant de commencer la seconde, et ainsi de suite. Ceci est particulièrement difficile avec les sauvegardes car la durée d'une sauvegarde est imprévisible. Plutôt que d'attendre un laps de temps spécifique pour qu'une sauvegarde ou une autre tâche se termine, j'ai mis en place une vérification de processus. Si mon processus est toujours en cours d'exécution, la tâche suivante ne démarre pas. Cette méthode garantit que vous ne manquez jamais un jeu de sauvegarde ou que vous ne parvenez pas à déplacer un jeu vers un autre stockage.

[ Vous recherchez une automatisation système plus avancée ? Démarrez avec The Automated Enterprise, un livre gratuit de Red Hat. ]

Conclusion

La gestion de l'espace pour les sauvegardes est un problème majeur pour les administrateurs système. L'espace est toujours un problème et les données augmentent à un rythme très élevé. En tant qu'administrateurs système, nous sommes toujours à la recherche de plus d'espace. Les utilisateurs ont besoin de plus d'espace. Les journaux grandissent continuellement. Les bases de données grandissent constamment. Les programmes sont de plus en plus vastes. Et chaque élément matériel envoie, reçoit ou stocke des données. Vous devez conserver les données conformément à la politique et effectuer des sauvegardes, mais vous avez également la responsabilité de préserver un espace disque précieux.


Linux
  1. Comment prévenir et récupérer de la suppression accidentelle de fichiers sous Linux

  2. Comment se connecter et envoyer des données à un port série Bluetooth sous Linux ?

  3. Linux – Répertoires standard et/ou communs sur les systèmes Unix/linux ?

  4. 10 exemples de commandes Tar sous Linux pour créer et extraire des archives

  5. Erreurs de disque silencieuses et fiabilité du swap Linux

Installer et utiliser MEGA Cloud Storage sous Linux

Comment sauvegarder et restaurer des données à l'aide de Retic sous Linux

Comment installer et utiliser Okteta pour les fichiers de données RAW sous Linux

Comment connecter et partager des données entre deux systèmes Linux

Comment configurer la cible de stockage Linux iSCSI et l'accès au client distant

Les 15 meilleurs logiciels économétriques et statistiques pour système Linux