Elasticsearch est un moteur de recherche et d'analyse en texte intégral open source hautement évolutif . Le logiciel prend en charge les opérations RESTful qui vous permettent de stocker, de rechercher et d'analyser de gros volumes de données rapidement et en temps quasi réel. Elasticsearch est apprécié et populaire parmi les administrateurs système et les développeurs car il s'agit d'un puissant moteur de recherche basé sur la bibliothèque Lucene. Il est généralement utilisé comme moteur/technologie sous-jacent qui alimente les applications avec des fonctionnalités et des exigences de recherche complexes.
Dans le didacticiel suivant, vous apprendrez comment installer Elastic Search sur Debian 11 Bullseye .
Prérequis
- OS recommandé : Debian 11 Bullseye
- Compte utilisateur : Un compte utilisateur avec un accès sudo ou root.
- Packages requis : Curl et Java
Installer Curl
Onduler est nécessaire pour certaines parties de ce guide. Pour installer ce package, tapez la commande suivante :
sudo apt install curl -y
Installer Java
Pour réussir l'installation et, plus important encore, utiliser Elasticsearch , vous devez installer Java . Le processus est assez simple.
Tapez la commande suivante pour installer OpenJDK paquet :
sudo apt install default-jdk
Exemple de sortie avec les packages à installer :
Pour poursuivre l'installation, tapez (Y) puis appuyez sur (ENTER) clé.
Ensuite, vérifiez la version Java installée et le build avec la commande suivante :
java -version
Exemple de résultat ci-dessous :
Installer Elasticsearch
Elasticsearch n'est pas disponible dans les référentiels standard Debian 11, vous devrez donc l'installer à partir du référentiel Elasticsearch APT.
Avant d'ajouter le référentiel, importez la clé GPG avec la commande suivante :
wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -
Exemple de sortie avec (Ok) confirmant qu'il a réussi :
Maintenant que vous avez ajouté la clé GPG, les référentiels Elasticsearch seront désormais approuvés. Procédez à l'installation du référentiel officiel avec la commande de terminal suivante :
sudo sh -c 'echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" > /etc/apt/sources.list.d/elastic-7.x.list'
Au moment de la création du didacticiel, Elasticsearch 7.13.4 est la dernière version mais changera avec le temps, et le référentiel que vous avez ajouté fonctionnera pour toutes les versions 7.x.x à l'avenir.
Ensuite, mettez à jour votre liste de référentiels et installez Elasticsearch comme suit :
sudo apt update && sudo apt install elasticsearch
Par défaut, le service Elasticsearch est désactivé au démarrage et non actif. Pour démarrer le service et l'activer au démarrage du système, tapez ce qui suit (systemctl) commande :
sudo systemctl enable elasticsearch.service --now
Ensuite, pour vérifier qu'Elasticsearch fonctionne correctement, vous utiliserez la curl commande pour envoyer une requête HTTP au port 9200 sur localhost comme suit :
curl -X GET "localhost:9200/"
Exemple de sortie pour vérifier qu'Elasticsearch fonctionne correctement :
Pour afficher le message système qu'Elasticsearch enregistre sur votre système, saisissez la commande suivante :
sudo journalctl -u elasticsearch
Exemple de journal de sortie :
Configurer Elasticsearch
Les données Elasticsearch sont stockées dans l'emplacement du répertoire par défaut (/var/lib/elasticsearch) . Pour afficher ou modifier les fichiers de configuration, vous pouvez les trouver à l'emplacement du répertoire (/etc/elasticsearch) , et les options de démarrage Java peuvent être configurées dans (/etc/default/elasticsearch) fichier de configuration.
Les paramètres par défaut conviennent généralement aux serveurs d'exploitation uniques, car Elasticsearch s'exécute sur localhost seul. Cependant, si vous envisagez de configurer un cluster, vous devrez modifier le fichier de configuration pour autoriser les connexions à distance.
Configurer l'accès à distance (facultatif)
Par défaut, Elasticsearch n'écoute que localhost. Pour changer cela, ouvrez le fichier de configuration comme suit :
sudo nano /etc/elasticsearch/elasticsearch.yml
Ensuite, faites défiler vers le bas et trouvez la section Réseau et décommentez (#) la ligne suivante et remplacez-la par l'adresse IP privée interne ou l'adresse IP externe comme suit :
Dans l'exemple, nous avons décommenté (#) le (network.host) et l'a remplacé par une adresse IP privée interne.
Pour des raisons de sécurité, il est idéal pour spécifier des adresses; cependant, si vous avez plusieurs adresses IP internes ou externes sur le serveur, modifiez l'interface réseau pour écouter tout le monde en saisissant (0.0.0.0) comme suit :
Ensuite, enregistrez le fichier de configuration (CTRL+O) puis quittez (CLTR+X) .
Vous devrez redémarrer le service Elasticsearch avec la commande suivante pour que les modifications prennent effet :
sudo systemctl restart elasticsearch
Configurer le pare-feu UFW pour autoriser les connexions à distance
Si vous autorisez les connexions à distance, vous devrez autoriser votre pare-feu à autoriser ces adresses IP à se connecter. Cela peut être fait avec la commande suivante :
sudo ufw allow from <IP Address> to any port 9200
Vous trouverez plus d'informations sur Debian et le pare-feu UFW pour configurer le pare-feu UFW sur Debian.
Comment utiliser Elasticsearch
Pour utiliser Elasticsearch à l'aide de la commande curl est un processus simple. Voici quelques-uns des plus couramment utilisés :
Supprimer l'index
Sous l'index est nommé samples .
curl -X DELETE 'http://localhost:9200/samples'
Répertorier tous les index
curl -X GET 'http://localhost:9200/_cat/indices?v'
Répertorier tous les documents dans l'index
curl -X GET 'http://localhost:9200/sample/_search'
Requête utilisant des paramètres d'URL
Ici, nous utilisons le format de requête Lucene pour écrire q=school:Harvard.
curl -X GET http://localhost:9200/samples/_search?q=school:Harvard
Requête avec JSON alias Elasticsearch Query DSL
Vous pouvez interroger à l'aide de paramètres sur l'URL. Mais vous pouvez également utiliser JSON, comme illustré dans l'exemple suivant. JSON serait plus facile à lire et à déboguer lorsque vous avez une requête complexe qu'une chaîne géante de paramètres d'URL.
curl -XGET --header 'Content-Type: application/json' http://localhost:9200/samples/_search -d '{
"query" : {
"match" : { "school": "Harvard" }
}
}'
Mappage d'index de liste
Tous les champs Elasticsearch sont des index. Donc, cela répertorie tous les champs et leurs types dans un index.
curl -X GET http://localhost:9200/samples
Ajouter des données
curl -XPUT --header 'Content-Type: application/json' http://localhost:9200/samples/_doc/1 -d '{
"school" : "Harvard"
}'
Mettre à jour le document
Voici comment ajouter des champs à un document existant. Tout d'abord, nous en créons un nouveau. Ensuite, nous le mettons à jour.
curl -XPUT --header 'Content-Type: application/json' http://localhost:9200/samples/_doc/2 -d '
{
"school": "Clemson"
}'
curl -XPOST --header 'Content-Type: application/json' http://localhost:9200/samples/_doc/2/_update -d '{
"doc" : {
"students": 50000}
}'
Index de sauvegarde
curl -XPOST --header 'Content-Type: application/json' http://localhost:9200/_reindex -d '{
"source": {
"index": "samples"
},
"dest": {
"index": "samples_backup"
}
}'
Charger des données en masse au format JSON
export pwd="elastic:"
curl --user $pwd -H 'Content-Type: application/x-ndjson' -XPOST 'https://58571402f5464923883e7be42a037917.eu-central-1.aws.cloud.es.io:9243/0/_bulk?pretty' --data-binary @<file>
Afficher l'état du cluster
curl --user $pwd -H 'Content-Type: application/json' -XGET https://58571402f5464923883e7be42a037917.eu-central-1.aws.cloud.es.io:9243/_cluster/health?pretty
Agrégation et agrégation de buckets
Pour un serveur Web Nginx, cela produit le nombre de visites Web par ville d'utilisateur :
curl -XGET --user $pwd --header 'Content-Type: application/json' https://58571402f5464923883e7be42a037917.eu-central-1.aws.cloud.es.io:9243/logstash/_search?pretty -d '{
"aggs": {
"cityName": {
"terms": {
"field": "geoip.city_name.keyword",
"size": 50
}
}
}
}
'
Cela étend cela au nombre de codes de réponse de produit par ville dans un journal de serveur Web Nginx
curl -XGET --user $pwd --header 'Content-Type: application/json' https://58571402f5464923883e7be42a037917.eu-central-1.aws.cloud.es.io:9243/logstash/_search?pretty -d '{
"aggs": {
"city": {
"terms": {
"field": "geoip.city_name.keyword"
},
"aggs": {
"responses": {
"terms": {
"field": "response"
}
}
}
},
"responses": {
"terms": {
"field": "response"
}
}
}
}'
Utiliser ElasticSearch avec l'authentification de base
Si vous avez activé la sécurité avec ElasticSearch, vous devez fournir l'utilisateur et le mot de passe comme indiqué ci-dessous à chaque commande curl :
curl -X GET 'http://localhost:9200/_cat/indices?v' -u elastic:(password)
Jolie impression
Ajoutez ?pretty=true à n'importe quelle recherche pour imprimer joliment le JSON. Comme ceci :
curl -X GET 'http://localhost:9200/(index)/_search'?pretty=true
Pour interroger et renvoyer uniquement certains champs
Pour ne renvoyer que certains champs, placez-les dans le tableau _source :
GET filebeat-7.6.2-2020.05.05-000001/_search
{
"_source": ["suricata.eve.timestamp","source.geo.region_name","event.created"],
"query": {
"match" : { "source.geo.country_iso_code": "GR" }
}
}
Pour interroger par date
Lorsque le champ est de type date, vous pouvez utiliser les calculs de date, comme ceci :
GET filebeat-7.6.2-2020.05.05-000001/_search
{
"query": {
"range" : {
"event.created": {
"gte" : "now-7d/d"
}
}
}
}
Désinstaller Elasticsearch
Si vous n'avez plus besoin d'Elasticsearch, vous pouvez supprimer le logiciel avec la commande suivante :
sudo apt remove elasticsearch
Supprimez le référentiel apt comme suit :
sudo rm /etc/apt/sources.list.d/elastic-7.x.list
Ensuite, mettez à jour votre liste de référentiels pour refléter les modifications :
sudo apt update