Dans ce didacticiel, nous allons vous montrer comment installer Apache Airflow sur Ubuntu 20.04 LTS. Pour ceux d'entre vous qui ne le savaient pas, Airflow est l'une des solutions de gestion de flux de travail les plus populaires, il crée, planifie et surveille les flux de travail. Airflow est écrit en Python et les flux de travail sont créés via des scripts Python. Airflow est conçu selon le principe de la "configuration en tant que code".
Cet article suppose que vous avez au moins des connaissances de base sur Linux, que vous savez utiliser le shell et, plus important encore, que vous hébergez votre site sur votre propre VPS. L'installation est assez simple et suppose que vous s'exécutent dans le compte root, sinon vous devrez peut-être ajouter 'sudo
‘ aux commandes pour obtenir les privilèges root. Je vais vous montrer pas à pas l'installation de l'outil de gestion des workflows Apache Airflow sur Ubuntu 20.04 (Focal Fossa). Vous pouvez suivre les mêmes instructions pour Ubuntu 18.04, 16.04 et toute autre distribution basée sur Debian comme Linux Mint.
Prérequis
- Un serveur exécutant l'un des systèmes d'exploitation suivants :Ubuntu 20.04, 18.04, 16.04 et toute autre distribution basée sur Debian comme Linux Mint.
- Il est recommandé d'utiliser une nouvelle installation du système d'exploitation pour éviter tout problème potentiel.
- Accès SSH au serveur (ou ouvrez simplement Terminal si vous êtes sur un ordinateur).
- Un
non-root sudo user
ou l'accès à l'root user
. Nous vous recommandons d'agir en tant qu'non-root sudo user
, cependant, car vous pouvez endommager votre système si vous ne faites pas attention lorsque vous agissez en tant que root.
Installer Apache Airflow sur Ubuntu 20.04 LTS Focal Fossa
Étape 1. Tout d'abord, assurez-vous que tous vos packages système sont à jour en exécutant le apt
suivant commandes dans le terminal.
sudo apt update sudo apt upgrade
Étape 2. Installation de la base de données MySQL.
Le serveur MySQL est requis. Si vous n'avez pas installé MySQL, vous pouvez suivre notre guide ici.
Étape 3. Installation de Pip.
Exécutez la commande suivante pour installer Pip sur votre système :
sudo apt-get install software-properties-common sudo apt-add-repository universe sudo apt-get update sudo apt-get install python-setuptools sudo apt install python3-pip
Étape 4. Installation d'Apache Airflow sur Ubuntu 20.04.
Avant d'installer Apache Airflow, vous devez exécuter les commandes suivantes pour vous assurer que les dépendances nécessaires sont installées :
sudo apt-get install libmysqlclient-dev sudo apt-get install libssl-dev sudo apt-get install libkrb5-dev
Une fois terminé, installez Apache Airflow à l'aide de la commande ci-dessous :
sudo apt install python3-virtualenv virtualenv airflow_idroot cd airflow_idroot/ source activate export AIRFLOW_HOME=~/airflow install apache-airflow pip3 install typing_extensions airflow db init airflow webserver -p 8080
Étape 5. Accéder à l'interface Web d'Apache Airflow.
Une fois l'installation réussie, ouvrez un navigateur Web et saisissez l'URL :https://localhost:8080
. Vous devriez voir la page suivante :
Félicitations ! Vous avez installé Apache Airflow avec succès. Merci d'avoir utilisé ce didacticiel pour l'installation de l'outil de gestion des flux de travail Apache Airflow sur le système Ubuntu 20.04 LTS Focal Fossa. Pour obtenir de l'aide ou des informations utiles, nous vous recommandons consultez le site Web officiel d'Apache Airflow.