Qu'est-ce qu'Apache Hive ? Le logiciel d'entrepôt de données Apache Hive facilite l'interrogation et la gestion de grands ensembles de données résidant dans un stockage distribué. Hive fournit un mécanisme pour projeter la structure sur ces données et interroger les données à l'aide d'un langage de type SQL appelé HiveQL. En savoir plus sur le site officiel
Ce guide pratique vous aidera à installer Apache Hive sur CentOS/RHEL avec Hadoop en quelques étapes simples.
Étape 1 :Installer JAVA et Hadoop
Apache Hive nécessite Java 6 ou une version ultérieure. Nous devons également installer hadoop avant d'installer apache hive sur notre système. Utilisez les liens ci-dessous pour les installer
Étapes pour installer JAVA sur CentOS et RHEL 7/6/5
Étapes pour installer Hadoop sur Linux
Étape 2 :Télécharger l'archive Hive
Après avoir configuré hadoop avec succès sur votre système Linux. commençons la configuration de la ruche. Téléchargez d'abord le dernier code source de la ruche et extrayez l'archive à l'aide des commandes suivantes.
# cd /home/hadoop# wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz# tar xzf hive-0.12.0 -bin.tar.gz# mv hive-0.12.0-bin hive# chown -R hadoop hive
Étape 3 :Configurer les variables d'environnement
Après avoir extrait le fichier d'archive de la ruche, passez à l'utilisateur hadoop et configurez les variables d'environnement suivantes.
# su - hadoop$ export HADOOP_HOME=/home/hadoop/hadoop$ export HADOOP_PREFIX=/home/hadoop/hadoop$ export HIVE_HOME=/home/hadoop/hive$ export PATH=$HIVE_HOME/bin:$PATHÉtape 4 :Démarrer la ruche
Avant d'exécuter la ruche, nous devons créer /tmp et /user/hive/warehouse et définissez-les chmod g+w dans HDFS avant de créer une table dans Hive. Utilisez les commandes suivantes.
$ cd /home/hadoop/hive$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse$ $HADOOP_HOME/bin/hadoop fs -chmod g +w /tmp$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouseCommençons à utiliser hive en utilisant la commande suivante.
$ bin/hiveLogging initialisé à l'aide de la configuration dans jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.propertieshive>Étape 5 :Créer une table de démonstration et tester
À ce stade, vous avez installé Hive avec succès. Créons un exemple de table en utilisant la commande suivante
hive> CREATE TABLE demo1 (id int, name string);OKTime pris :6,565 secondesAffichez les tables créées avec la commande ci-dessous.
hive> SHOW TABLES;OKdemo1Temps pris :0,231 seconde, récupéré :1 ligne(s)Déposez le tableau à l'aide de la commande ci-dessous.
hive> DROP TABLE demo1;OKTemps pris :2,393 secondesEn savoir plus sur les opérations SQL sur la ruche sur le site officiel apache hive.