Apache Cassandra est une base de données distribuée NoSQL open source qui offre évolutivité et haute disponibilité sans compromettre les performances et est approuvée par des milliers d'entreprises. L'évolutivité linéaire et la tolérance aux pannes éprouvée sur le matériel de base et l'infrastructure cloud en font une plate-forme idéale pour les données critiques. Ce tutoriel décrit comment installer Apache Cassandra sur un serveur Ubuntu 20.04.
Prérequis#
- Un serveur Ubuntu 20.04
- Créez un utilisateur non root avec un accès sudo.
- Pour utiliser cqlsh, la dernière version de Python 2.7 ou Python 3.6+. Pour vérifier que vous avez installé la bonne version de Python, tapez
python --version
Installer Apache Cassandra#
-
Installer Java 8
Installez la dernière version de Java 8, soit Oracle Java Standard Edition 8 ou OpenJDK 8.
$ sudo apt install openjdk-8-jdk -y
Pour vérifier que vous avez installé la bonne version de Java, tapez
java -version
.$ java -version
La sortie peut être :
openjdk version "1.8.0_222" OpenJDK Runtime Environment (build 1.8.0_222-8u222-b10-1ubuntu1~16.04.1-b10) OpenJDK 64-Bit Server VM (build 25.222-b10, mixed mode)
-
Installez les dépendances requises.
$ sudo apt install apt-transport-https gnupg2 -y
-
Téléchargez et ajoutez la clé Apache Cassandra GPG.
$ sudo wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
Vous pouvez voir la sortie :
% Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 266k 100 266k 0 0 320k 0 --:--:-- --:--:-- --:--:-- 320k OK
-
Ajoutez le référentiel Apache Cassandra à votre système.
$ echo "deb http://www.apache.org/dist/cassandra/debian 40x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
-
Mettre à jour l'index du package.
$ sudo apt-get update
-
Installez Apache Cassandra.
$ sudo apt-get install cassandra -y
-
Vérifiez qu'Apache Cassandra est installé.
$ dpkg -l | grep cassandra
-
Vérifiez qu'Apache Cassandra est en cours d'exécution.
$ sudo systemctl status cassandra
-
Vérifiez les statistiques de votre nœud.
$ sudo nodetool status
La colonne d'état dans la sortie doit indiquer UN, qui signifie "Up/Normal".
Sinon, connectez-vous à la base de données avec :
$ cqlsh
Le résultat devrait ressembler à ceci :
Connected to Test Cluster at localhost:9042. [cqlsh 5.0.1 | Cassandra 3.8 | CQL spec 3.4.2 | Native protocol v4] Use HELP for help.
Configuration d'Apache Cassandra#
La Cassandre l'emplacement des fichiers de configuration varie selon le type d'installation :
- archive :
conf
répertoire dans l'emplacement d'installation de l'archive tar - forfait :
/etc/cassandra
répertoire
Puisque nous installons à l'aide d'un package, nous utiliserons le /etc/cassandra
répertoire.
-
Modifiez le
cassandra.yaml
fichier.$ sudo nano /etc/cassandra/cassandra.yaml
Le fichier est un fichier YAML qui contient la configuration d'Apache Cassandra.
Le fichier est divisé en sections. Les sections sont séparées par une ligne qui commence par un
#
caractère.Mettons à jour le
cluster_name
rubrique.# cluster_name: The name of the cluster. cluster_name: My First Cluster
Le
cluster_name
est utilisée pour identifier le cluster. -
Vider le cache système
$ nodetool flush system
Le
flush system
la commande efface le cache système.Le cache système est utilisé pour stocker des informations sur le cluster. Ces informations sont utilisées pour accélérer le démarrage du cluster. Le cache système est vidé en exécutant le
flush system
commande. Cette commande est utile lorsque vous souhaitez démarrer le cluster avec une configuration différente. Par exemple, vous souhaiterez peut-être démarrer le cluster avec un nombre différent de nœuds. -
Redémarrez le service Cassandra.
$ sudo systemctl restart cassandra
Le
systemctl
La commande est utilisée pour démarrer, arrêter, redémarrer et activer/désactiver le service. -
Vérifiez le changement
$ cqlsh