GNU/Linux >> Tutoriels Linux >  >> Cent OS

Qu'est-ce qu'une base de données ?

Présentation

Les bases de données sont l'épine dorsale de tous les systèmes d'information modernes. Étant donné que les ordinateurs stockent des bases de données contemporaines, les données peuvent être de n'importe quelle taille et complexité. Il existe de nombreuses façons de collecter et d'organiser les données en fonction de l'utilisation et du type de données.

Cet article fournit un aperçu complet des bases de données et des systèmes de bases de données.

Définition de la base de données

Une base de données est un ensemble organisé de données logiquement connectées. Les informations se transforment en connaissances utiles, structurées et maintenues pour répondre aux besoins de l'utilisateur. Outre le stockage des données elles-mêmes, une base de données conserve également les relations entre les points de données.

Au sens large, une base de données est un ensemble intégré d'informations sur un système et les procédures de maintenance et d'utilisation. Contrairement aux feuilles de calcul, plusieurs utilisateurs et applications accèdent simultanément au stockage.

À quoi servent les bases de données ?

Les bases de données ont un large spectre d'applications. Les exemples typiques incluent :

  • Systèmes bancaires conserver des bases de données pour les clients, les comptes bancaires, les crédits, les transactions, etc.
  • Trafic aérien conserve les informations sur les vols, les réservations de billets, etc. Les compagnies aériennes sont le premier secteur à utiliser des bases de données réparties géographiquement.
  • Universités utiliser des bases de données pour enregistrer des informations sur les étudiants, les candidatures, les notes, les cours, etc.
  • Transactions par carte de crédit contiennent des onglets sur les paiements et génèrent des rapports mensuels.
  • Entreprises de télécommunications stocker des informations sur les appels, générer des factures mensuelles, suivre la ligne de communication, etc.
  • Le secteur financier suit les ventes et les achats d'instruments financiers tels que les obligations et les actions.
  • Commerce et commerce électronique entreprises stocker des données sur les consommateurs, les produits et divers catalogues de prix.
  • Entreprises manufacturières gérer les chaînes d'approvisionnement, les lignes de production, les entrepôts, générer des factures, etc.
  • Ressources humaines stocke des informations sur les employés, les chèques de paie, les impôts, les avantages, etc.

La liste ci-dessus montre à quel point les bases de données sont cruciales pour tout type d'entreprise. Avec les interfaces utilisateur modernes, le backend est masqué lors de l'accès à une base de données, de sorte que de nombreux utilisateurs ne savent pas qu'ils en utilisent une quotidiennement.

Un bref historique des bases de données

La première base de données automatisée se connecte à Herman Hollerith, qui a breveté le système de traitement automatique des données en 1884. Le recensement américain de 1890 a utilisé le système de compteur de cartes perforées, et la collection de cartes représente le premier système de base de données automatisé.

Chaque carte avait 80 colonnes et caractérisait des informations sur une personne. Habituellement, les informations du recensement prendraient deux ans à traiter. Cependant, le système de cartes perforées et le mécanisme de lecture automatisée des cartes n'ont pris qu'environ six semaines pour traiter les données. Le système des cartes perforées a été utilisé tout au long du XXe siècle, notamment pour voter et pointer au travail.

Après la Seconde Guerre mondiale, les entreprises et les institutions gouvernementales ont commencé à utiliser des ordinateurs pour de simples bases de données comptables linéaires. Les premières bases de données informatisées étaient utilisées pour des tâches spécifiques et manquaient de flexibilité.

Bases de données dans les années 1960

Dans les années 1960, les bases de données documentaires occupent une place prépondérante. Les premiers systèmes de gestion de bases de données sont apparus au cours de cette décennie, et ils ont été utilisés pour des projets importants et complexes, tels que l'alunissage d'Apollo.

Les bases de données dans les années 1970

Les bases de données deviennent une réalité commerciale dans les années 1970. Des systèmes hiérarchiques et en réseau pour la gestion des données sont introduits principalement pour gérer des structures de données complexes, telles que des comptes d'usine, lors de l'achat de matières premières.

Cette décennie comprend les SGBD commerciaux de première génération, et certains sont encore utilisés aujourd'hui. Plusieurs inconvénients sont :

  • Les données étaient difficiles à récupérer. Les entreprises utilisaient des programmes complexes dans les années 1970 pour accéder à des données simples.
  • L'indépendance limitée des données a rendu les informations difficiles à modifier et à mettre à jour.
  • Aucun fondement théorique pour les modèles de base de données.

Les bases de données dans les années 1980

Les années 1980 remédient aux inconvénients de la décennie précédente. Le modèle de données relationnelles apparaît dans les années 1970 et le SGBD de deuxième génération trouve une utilisation commerciale dans les années 1980. Lorsque vous utilisez le modèle relationnel, toutes les données sont dans un format tabulaire familier. Un langage de programmation relativement simple (SQL) récupère les données de la base de données.

Le nouveau modèle de base de données a permis un accès plus facile aux données pour les personnes qui n'étaient pas des programmeurs, résolvant le problème le plus important avec les modèles précédents. Le modèle relationnel était pratique pour la communication client/serveur, les transferts de données parallèles et une interface graphique simplifiait l'utilisation.

Les bases de données dans les années 1990

Les années 1990 ont donné naissance aux applications Internet et aux systèmes de stockage de données. Les données multimédias (graphiques, sons, images et vidéos) sont devenues plus courantes. Des quantités massives de données structurées et non structurées étaient standard. En raison de la complexité croissante des données, les systèmes de bases de données relationnelles se sont tournés vers l'approche orientée objet.

Les bases de données dans les années 2000

Trois nouveaux types de bases de données apparaissent :les bases de données XML, NoSQL et NewSQL.

Les bases de données XML sont un type basé sur des documents hautement structurés. L'interrogation est autorisée via des attributs XML avec différents degrés de flexibilité.

Les bases de données NoSQL répondent à la forte demande de systèmes de bases de données distribuées hautement flexibles, qui utilisent la cohérence à terme et ne nécessitent pas de schéma fixe. Le type NoSQL est hautement évolutif et stocke des données dénormalisées.

NewSQL vise à combiner les meilleurs attributs des bases de données NoSQL, tels que l'évolutivité, tout en utilisant SQL et en maintenant la conformité ACID.

Différents types de bases de données

Il existe actuellement de nombreux types de bases de données différents, chacun présentant des avantages et des inconvénients. Chaque type de base de données crée un environnement spécifique pour le stockage des données et la relation entre les informations.

  • Les bases de données relationnelles stockent les données dans des structures de type table sous forme de lignes et de colonnes en mettant l'accent sur la cohérence des données. Ce type de base de données se concentre sur les relations entre les données, et c'est le type de base de données le plus largement utilisé.
  • Les bases de données orientées objet associent les principes de la programmation orientée objet (POO) aux normes des bases de données relationnelles.
  • Bases de données distribuées réparties sur plusieurs sites et mises à l'échelle horizontalement
  • Les entrepôts de données intègrent de manière cohérente des données provenant de diverses sources dans un seul système d'aide à la décision. Les entrepôts traitent de gros volumes de données et résident généralement sur des serveurs Big Data.
  • Les bases de données NoSQL sont des types de bases de données structurellement divers axés sur la haute disponibilité. Les systèmes NoSQL sont mieux adaptés aux gros volumes de données non structurées.
  • Les bases de données de graphes sont un type de base de données NoSQL axées sur les relations entre les points de données. Avec une structure de réseau topographique, les bases de données de graphes sont le meilleur système pour explorer et découvrir des relations.
  • Les bases de données OLTP se concentrent sur les transactions quotidiennes courtes, prenant en charge une large base d'utilisateurs avec une intégrité des données et une efficacité élevées dans les requêtes simultanées.
  • Les bases de données open source sont ouvertes aux modifications et libres d'utilisation. Les préférences utilisateur personnalisables et le faible coût rendent ce type de base de données largement adopté.
  • Les bases de données cloud disposent de toutes les fonctionnalités de base de données traditionnelles avec la flexibilité du cloud computing.
  • Les bases de données multimodèles fournissent un moteur unique pour travailler avec plusieurs types de modèles de base de données.
  • La base de données Document/JSON est un système de stockage NoSQL qui stocke les données dans des documents JSON.
  • Les bases de données cloud autonomes (bases de données autonomes) utilisent le machine learning pour automatiser diverses tâches dans le SGBD.

Composants d'une base de données

Cinq composants principaux constituent un système de base de données.

Matériel

Le matériel englobe les dispositifs physiques qui connectent les ordinateurs au monde réel. En ce qui concerne les bases de données, les serveurs, les disques de stockage et divers dispositifs de collecte de données, incluent le matériel nécessaire pour exécuter et remplir une base de données.

Logiciel

Le logiciel comprend un large éventail de programmes utilisés pour accéder, manipuler et contrôler les bases de données. Aux niveaux inférieurs, le logiciel comprend les systèmes d'exploitation sur lesquels résident les bases de données, le réseau de communication avec les bases de données et le logiciel d'accès aux données.

Données

Les données sont le fait essentiel d'un élément ou d'un événement que la base de données peut enregistrer. Les données nécessitent un traitement pour prendre du sens et devenir des informations. De plus, le traitement extrait des détails pertinents des données et facilite les procédures de prise de décision.

Procédures

Les procédures de base de données incluent toutes les fonctions opérant dans un stockage. Qu'il s'agisse de sauvegardes régulières, de génération de rapports ou d'autres opérations quotidiennes, les procédures sont un ensemble d'instructions exécutées dans le système de gestion de base de données.

Langage d'accès à la base de données

Le langage d'accès à la base de données est le langage de programmation utilisé pour insérer, mettre à jour, supprimer et modifier les données stockées dans une base de données. Les bases de données exécutent directement les requêtes dans le langage d'accès à la base de données.

Qu'est-ce qu'un système de gestion de base de données (SGBD) ?

Un système de gestion de base de données (SGBD) sert d'interface entre l'utilisateur (ou les applications) et la base de données. Le programme permet une communication directe avec la base de données, permettant la récupération des données, les mises à jour, l'optimisation et la gestion globale des informations stockées dans la base de données.

Qu'est-ce qu'un serveur de base de données ?

Un serveur de base de données est un serveur dédié qui fournit des services à un client via des applications de base de données. Une partie du serveur stocke le SGBD, tandis qu'une autre stocke la base de données elle-même. Habituellement, les serveurs de bases de données ont une grande capacité de stockage et de nombreuses clés USB.

Pourquoi les bases de données sont-elles importantes ?

Un système de base de données stocke des données essentielles sur une entreprise :les données, une fois analysées, deviennent des informations précieuses sur une entreprise et aident au processus de prise de décision.

De même, une base de données aide à créer des archives sur l'entreprise, ce qui rend une entreprise plus robuste et consciente de la direction qu'elle prend lorsqu'elle fait des choix. Le stockage de données sur une interaction permet de fournir un aperçu des informations pour aider l'entreprise à se développer davantage et à augmenter ses bénéfices.

L'utilisation d'un système avec une base de données présente de nombreux avantages :

  • Indépendance entre les programmes et les données . Séparer les métadonnées des applications qui utilisent des données est un attribut clé. La principale caractéristique de la base de données est la possibilité de modifier et de transférer les données d'une organisation vers un système informatique différent sans modifier les programmes qui traitent les informations.
  • Redondance minimale des données . Les bases de données relèvent le défi de la répétition des données. Les informations s'intègrent dans une structure logique et chaque élément de données se répète au minimum. Cependant, les bases de données n'éliminent pas entièrement les redondances. Le système permet à un concepteur de base de données de planifier l'étendue des redondances en fonction du cas d'utilisation.
  • Amélioration du partage des données. Les bases de données sont une ressource d'entreprise que de nombreux employés et secteurs utilisent. Des utilisateurs internes et externes spécifiques gèrent la base de données, et chaque personne ou groupe a des vues spécialisées des données.
  • Plus grande sécurité des données. Un SGBD possède des fonctions administratives qui aident à contrôler la sécurité des informations sensibles par le biais de privilèges et de rôles d'utilisateur.
  • Amélioration de la productivité du développement d'applications. Le développement de nouvelles applications est plus rapide grâce aux systèmes de bases de données. Un programmeur peut se concentrer sur les fonctions nécessaires à une nouvelle application sans avoir à définir de données. Un SGBD permet d'automatiser des activités telles que la conception et la mise en œuvre d'une base de données.

Défis courants de la base de données

Les bases de données contiennent des défis, des risques et des dépenses lors de la construction du système.

Formation du personnel Une entreprise qui opte pour un système de base de données doit recruter ou former des personnes pour concevoir, mettre en œuvre et gérer une base de données. En raison de la nature en constante évolution, une formation continue est nécessaire pour maximiser l'efficacité des technologies de base de données.
Dépenses et complexités d'installation et de gestion Les systèmes de bases de données multi-utilisateurs sont des architectures logicielles étendues et complexes, souvent avec des coûts annuels pour le support technique et les extensions. Les extensions logicielles avec des améliorations continues en matière de sécurité sont indispensables lorsque vous travaillez avec des données.
Sauvegardes, restauration et sécurité Des sauvegardes régulières garantissent la cohérence des données et une haute disponibilité. Des procédures de sécurité claires et une récupération de base de données sont nécessaires pour un système de base de données moderne.
Conflits d'organisation Les bases de données partagées nécessitent un consentement sur la définition et la propriété des données. De plus, une personne dédiée est nécessaire pour maintenir les données. Par conséquent, un administrateur de base de données compétent et des rôles d'accès significatifs sont nécessaires.

L'avenir des bases de données

La technologie ayant le plus d'impact potentiel pour l'avenir des bases de données est celle des bases de données autonomes. L'apprentissage automatique permet d'automatiser entièrement le provisionnement, la gestion, le réglage et les mises à niveau d'une base de données. L'automatisation permet également de mettre davantage l'accent sur la sécurité des bases de données, qui est le plus grand défi auquel les systèmes seront confrontés à l'avenir.


Cent OS
  1. Qu'est-ce qu'une base de données NoSQL ? - NoSQL expliqué

  2. Types de base de données NoSQL

  3. Qu'est-ce qu'un DataFrame Spark ?

  4. Qu'est-ce qu'une base de données relationnelle ?

  5. Base de données NoSQL distribuée Elasticsearch - Qu'est-ce que c'est et devriez-vous l'utiliser ?

Qu'est-ce qu'une base de données documentaire ?

Qu'est-ce qu'une base de données OLTP ?

Qu'est-ce que la dénormalisation de la base de données ?

Qu'est-ce que la normalisation de base de données ?

Qu'est-ce que NewSQL ?

Qu'est-ce qu'une base de données distribuée et à quoi servent les systèmes de données distribués ?