GNU/Linux >> Tutoriels Linux >  >> Linux

Qu'est-ce qu'une base de données distribuée et à quoi servent les systèmes de données distribués ?

Les bases de données distribuées offrent certains avantages clés par rapport aux bases de données centralisées. De nombreuses entreprises se tournent vers des bases de données distribuées (dans lesquelles la base de données, comme son nom l'indique, est distribuée sur un ensemble de serveurs à divers endroits) pour diverses raisons. Examinons quelques-uns des avantages de base des bases de données distribuées, un scénario typique dans lequel elles sont utilisées et les différents formats dans lesquels les données sont distribuées dans le système de données distribué.

Pourquoi les bases de données distribuées deviennent de plus en plus populaires

Voici les raisons fondamentales pour lesquelles de nombreuses organisations abandonnent le modèle centralisé en faveur de la distribution de bases de données :

  1. Fiabilité – Construire des infrastructures, c'est comme investir :diversifiez-vous pour réduire vos risques de perte. Plus précisément, si une panne se produit dans une zone de distribution, la base de données entière ne connaît pas de revers.
  2. Sécurité – Vous pouvez accorder des autorisations à des sections individuelles de la base de données globale pour une meilleure protection interne et externe.
  3. Economique – Les prix de la bande passante baissent car les utilisateurs accèdent moins fréquemment aux données distantes.
  4. Accès local – Comme pour le point 1 ci-dessus, en cas de défaillance du réseau parapluie, vous pouvez toujours accéder à votre partie de la base de données.
  5. Croissance – Si vous ajoutez un nouvel emplacement à votre entreprise, il est simple de créer un nœud supplémentaire dans la base de données, ce qui rend la distribution hautement évolutive.
  6. Vitesse et efficacité des ressources – La plupart des requêtes et autres interactions avec la base de données sont effectuées localement, ce qui réduit le trafic distant.
  7. Responsabilité et confinement – Étant donné que des problèmes ou des échecs se produisent localement, le problème est contenu. Il peut potentiellement être géré par le personnel informatique désigné pour gérer cette partie de l'entreprise.

Qui utilise les bases de données distribuées ?

Les bases de données distribuées sont souvent utilisées par des organisations qui ont de nombreux bureaux ou vitrines dans différents emplacements géographiques. En règle générale, une succursale individuelle interagit principalement avec les données relatives à ses propres opérations, avec un besoin beaucoup moins fréquent de données générales sur l'entreprise.
Dans ce cas, il existe un besoin incohérent d'informations centrales provenant des succursales. Cependant, le siège social de l'entreprise doit toujours recevoir un flux constant d'informations provenant de chaque emplacement.
Pour résoudre ce problème, une base de données distribuée fonctionne généralement en permettant à chaque emplacement de l'entreprise d'interagir directement avec sa propre base de données pendant les heures de travail. Pendant les heures creuses, chaque jour, toute la base de données reçoit un lot de données de chaque branche.

Types de données distribuées

Données répliquées – La réplication des données est utilisée pour créer des instances supplémentaires de données dans différentes parties de la base de données. En utilisant cette tactique, une base de données distribuée peut éviter un trafic excessif car des données identiques sont accessibles localement. Les données distribuées peuvent être divisées en cinq types de base, comme indiqué ci-dessous :

Cette forme de données est subdivisée en deux types différents :les données en lecture seule et les données inscriptibles. Les versions inscriptibles peuvent être ajustées, ce qui modifie immédiatement la première instance, avec diverses configurations pour savoir comment et quand toutes les réplications du système subissent la mise à jour. Les versions en lecture seule autorisent également les révisions de la première instance, puis les réplications sont ajustées en conséquence.

Dans ce système de données distribué, les mises à jour peuvent être configurées en fonction de l'importance que la base de données ait les bonnes spécificités à chaque instant (ou sur n'importe quelle période). Notez que la réplication est particulièrement utile lorsque vous n'avez pas besoin que les révisions apparaissent dans tout le système de données distribué en temps réel.

Ce type de données permet de fournir facilement des données de n'importe quelle section à n'importe quelle autre section de la base de données plus large si les données de cette dernière section sont compromises par une erreur. Sachez cependant qu'avec la réplication, les collisions peut arriver. Des mesures de protection doivent être en place pour les prévenir/résoudre.

Données fragmentées horizontalement – Cette catégorie de distribution de données implique l'utilisation de clés primaires (chacune faisant référence à un enregistrement dans la base de données). La fragmentation horizontale est couramment utilisée dans les situations où des sites commerciaux spécifiques n'ont généralement besoin d'accéder qu'à la base de données de leur succursale spécifique.

Données fragmentées verticalement – Avec la fragmentation verticale, les clés primaires sont à nouveau utilisées. Cependant, dans ce cas, des copies de la clé primaire sont disponibles dans chaque section de la base de données (accessible à chaque succursale). Ce type de format fonctionne bien dans les situations où une succursale d'une entreprise et l'emplacement central interagissent avec les mêmes comptes, mais peut-être de différentes manières (comme les modifications des coordonnées du client par rapport aux modifications des chiffres financiers).

Données réorganisées – La réorganisation signifie que les données ont été ajustées d'une manière ou d'une autre, comme cela est typique pour les bases de données d'aide à la décision. Dans certains cas, il existe deux systèmes distincts qui gèrent les transactions et l'aide à la décision. Alors que les systèmes d'aide à la décision peuvent être plus difficiles à maintenir techniquement, le traitement des transactions en ligne (OLTP) nécessite souvent une reconfiguration pour permettre un grand nombre de demandes.

Données de schéma séparé – Cette catégorie partitionne la base de données et les logiciels utilisés pour y accéder pour s'adapter à différents départements et situations – données utilisateur par rapport aux données produit, par exemple. Habituellement, il y a un chevauchement entre les différentes bases de données dans ce type de distribution.

Pour plus d'informations sur les types de bases de données distribuées et la sécurité, consultez notre article de blog à ce sujet ici. Atlantic.Net s'engage à suivre les meilleures nouvelles avancées technologiques via notre page de ressources qui contient des guides pratiques, des articles et des FAQ.

***

Comme vous pouvez le voir, les bases de données distribuées représentent une énorme avancée technologique. Il n'est pas surprenant que les entreprises délaissent les bases de données centralisées et adoptent le modèle distribué. Atlantic.net propose de nombreuses options d'hébergement pour diverses entreprises, notamment l'hébergement cloud privé Windows, les serveurs privés virtuels, l'hébergement de serveurs cloud gérés, l'hébergement conforme HIPAA et nos serveurs d'hébergement VPS SSD ultra-rapides primés.


Linux
  1. Quand Dd est-il adapté à la copie de données ? (ou, Quand Read() et Write() sont-ils partiels) ?

  2. Base de données NoSQL distribuée Elasticsearch - Qu'est-ce que c'est et devriez-vous l'utiliser ?

  3. A quoi sert le fichier .la de libtool ?

  4. Que sont vdso et vsyscall ?

  5. Commande top Linux :Que sommes-nous, sy, ni, id, wa, hi, si et st (pour l'utilisation du processeur) ?

Qu'est-ce qu'une base de données documentaire ?

Qu'est-ce qu'une base de données OLTP ?

Qu'est-ce que la dénormalisation de la base de données ?

Qu'est-ce qu'une base de données ?

Les 15 meilleurs systèmes de gestion de base de données pour Linux Desktop

Présentation des types de bases de données distribuées et de la sécurité