GNU/Linux >> Tutoriels Linux >  >> Ubuntu

Comment installer Apache Hive avec Hadoop sur CentOS, Ubuntu et LinuxMint

Qu'est-ce qu'Apache Hive ? Le logiciel d'entrepôt de données Apache Hive facilite l'interrogation et la gestion de grands ensembles de données résidant dans un stockage distribué. Hive fournit un mécanisme pour projeter la structure sur ces données et interroger les données à l'aide d'un langage de type SQL appelé HiveQL. En savoir plus sur le site officiel

Ce guide pratique vous aidera à installer Apache Hive sur CentOS/RHEL avec Hadoop en quelques étapes simples.

Étape 1 :Installer JAVA et Hadoop

Apache Hive nécessite Java 6 ou une version ultérieure. Nous devons également installer hadoop avant d'installer apache hive sur notre système. Utilisez les liens ci-dessous pour les installer

Étapes pour installer JAVA sur CentOS et RHEL 7/6/5
Étapes pour installer Hadoop sur Linux

Étape 2 :Télécharger l'archive Hive

Après avoir configuré hadoop avec succès sur votre système Linux. commençons la configuration de la ruche. Téléchargez d'abord le dernier code source de la ruche et extrayez l'archive à l'aide des commandes suivantes.

# cd /home/hadoop# wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz# tar xzf hive-0.12.0 -bin.tar.gz# mv hive-0.12.0-bin hive# chown -R hadoop hive

Étape 3 :Configurer les variables d'environnement

Après avoir extrait le fichier d'archive de la ruche, passez à l'utilisateur hadoop et configurez les variables d'environnement suivantes.

# su - hadoop$ export HADOOP_HOME=/home/hadoop/hadoop$ export HADOOP_PREFIX=/home/hadoop/hadoop$ export HIVE_HOME=/home/hadoop/hive$ export PATH=$HIVE_HOME/bin:$PATH 

Étape 4 :Démarrer la ruche

Avant d'exécuter la ruche, nous devons créer /tmp et /user/hive/warehouse et définissez-les chmod g+w dans HDFS avant de créer une table dans Hive. Utilisez les commandes suivantes.

$ cd /home/hadoop/hive$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse$ $HADOOP_HOME/bin/hadoop fs -chmod g +w /tmp$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse

Commençons à utiliser hive en utilisant la commande suivante.

$ bin/hiveLogging initialisé à l'aide de la configuration dans jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.propertieshive>

Étape 5 :Créer une table de démonstration et tester

À ce stade, vous avez installé Hive avec succès. Créons un exemple de table en utilisant la commande suivante

hive> CREATE TABLE demo1 (id int, name string);OKTime pris :6,565 secondes

Affichez les tables créées avec la commande ci-dessous.

hive> SHOW TABLES;OKdemo1Temps pris :0,231 seconde, récupéré :1 ligne(s)

Déposez le tableau à l'aide de la commande ci-dessous.

hive> DROP TABLE demo1;OKTemps pris :2,393 secondes

En savoir plus sur les opérations SQL sur la ruche sur le site officiel apache hive.


Ubuntu
  1. Comment installer le logiciel Ghost Blog avec Apache et SSL sur Ubuntu 16.04

  2. Comment installer Apache Hadoop sur CentOS 7, Ubuntu 18.04 et Debian 9

  3. Comment installer Apache Maven sur Ubuntu 18.04 et 16.04

  4. Comment installer Apache Hadoop sur Ubuntu 14.04

  5. Comment installer Apache Hadoop sur Ubuntu 18.04 LTS

Comment installer et configurer le module mod_pagespeed avec Apache sur Ubuntu 20.04 LTS

Comment installer le logiciel Ghost Blog avec Apache et SSL sur Ubuntu 15.10

Comment installer PrestaShop sur Ubuntu 20.04 avec Apache

Comment installer et configurer Hadoop sur Ubuntu 20.04

Comment installer Drupal avec Apache sur Debian et Ubuntu

Comment installer Django 3.2 sur Ubuntu 20.04 avec Apache et WSGI