Je travaille sur une machine en cluster qui utilise le gestionnaire de tâches Slurm. Je viens de commencer un code multithread et je voudrais vérifier l'utilisation du noyau et du thread pour un ID de nœud donné. Par exemple,
scoreusage -N 92512
où "scoreusage" est la commande dont je ne suis pas sûr.
Réponse acceptée :
Cela fait quelques années que je n'ai pas géré un cluster slurm, mais squeue
devrait te donner ce que tu veux. Essayez :
squeue --nodelist 92512 -o "%A %j %C %J"
(cela devrait donner votre jobid, jobname, cpus et threads pour vos travaux sur le nœud 92512)
BTW, à moins que vous ne souhaitiez spécifiquement que les détails d'un nœud particulier, vous feriez peut-être mieux de rechercher par ID de travail plutôt que par ID de nœud.
Il existe de nombreux bons sites avec de la documentation sur l'utilisation de slurm disponible sur le Web, facilement trouvable via google - la plupart des universités, etc. exécutant un cluster HPC écrivent leurs propres documents, aide et "aide-mémoire", adaptés aux détails de leur cluster spécifique (s) (prenez donc cela en compte et adaptez tous les exemples à VOTRE cluster). Il existe également une bonne documentation générique sur l'utilisation de slurm
sur https://slurm.schedmd.com/documentation.html