Cet article illustrera comment RHEVM surveille en détail la santé du stockage.
Surveiller l'intégrité du gestionnaire de pool de stockage
Le gestionnaire de pool de stockage (SPM) est un rôle de gestion attribué à l'un des hôtes d'un centre de données lui permettant de gérer les domaines de stockage du centre de données. RHEVM vérifie la disponibilité du SPM et l'intégrité des métadonnées à chaque fréquence d'interrogation du SPM pendant 10 secondes.
Vous pouvez vérifier la configuration de ces moteurs comme suit. Il n'est pas recommandé de modifier les paramètres ci-dessous, sauf si cela est recommandé par l'ingénieur de support pour un cas d'utilisation spécifique :
$ engine-config -g StoragePoolRefreshTimeInSeconds StoragePoolRefreshTimeInSeconds: 10 version: general $ engine-config -g SpmCommandFailOverRetries SpmCommandFailOverRetries: 3 version: general $ engine-config -g SPMFailOverAttempts SPMFailOverAttempts: 3 version: general $ engine-config -g DelayResetForSpmInSeconds DelayResetForSpmInSeconds: 20 version: general
Surveiller l'intégrité du domaine de stockage
La santé du domaine de stockage est surveillée à la fois par le moteur RHEVM et KVM Vdsm.
1. RHEVM surveille le domaine de stockage
L'intervalle de temps en secondes pour interroger l'état d'un hôte par RHEVM est de 3 secondes par défaut. Pendant le processus, il vérifiera l'état du stockage. Si le code des rapports getRepoStats est différent de zéro ou lastcheck(statsGenTime - domStatus.checkTime) supérieur à MaxStorageVdsTimeoutCheckSec (30 secondes par défaut), alors le domaine de stockage devient problématique et une minuterie démarre pour le domaine. Le délai d'expiration de l'échec du domaine de stockage est StorageDomainFailureTimeoutInMinutes (5 minutes par défaut). Si l'état du domaine de stockage problématique n'est pas récupéré pendant ce temps, l'hôte sera défini comme non opérationnel. Si le domaine problématique est récupéré pendant ce temps, RHEVM réactivera automatiquement l'hôte KVM.
Voici la configuration du moteur associée :
$ engine-config -g VdsRefreshRate VdsRefreshRate: 3 version: general $ engine-config -g StorageDomainFailureTimeoutInMinutes StorageDomainFailureTimeoutInMinutes: 5 version: general $ engine-config -g MaxStorageVdsTimeoutCheckSec MaxStorageVdsTimeoutCheckSec: 30 version: general $ engine-config -g MaxStorageVdsDelayCheckSec MaxStorageVdsDelayCheckSec: 5 version: general
2. Surveillance de l'intégrité du stockage de l'hôte KVM :
Si l'hôte KVM ne peut pas accéder aux domaines de stockage, il deviendra non opérationnel. Vdsm actualisera le stockage avec l'intervalle de surveillance sd_health_check_delay. Il appelle getStorageDomainStats pour obtenir dom.getStats le statut du domaine et renvoyer son statut à RHEVM via repoStats dans _getDomsStats. Repo_stats_cache_refresh_timeout et sd_health_check_delay peuvent être configurés dans /etc/vdsm/vdsm.conf .