Comment rediriger toute la sortie de spark-submit vers un fichier

spark-submit imprime la plupart de sa sortie sur STDERR

Pour rediriger toute la sortie vers un seul fichier, vous pouvez utiliser :

spark-submit something.py > results.txt 2>&1

Ou

spark-submit something.py &> results.txt

Si vous exécutez Spark-Submit sur un cluster, les journaux sont stockés avec l'ID d'application. Vous pouvez voir les journaux une fois l'application terminée.

yarn logs --applicationId <your applicationId> > myfile.txt

Devrait vous récupérer le journal de votre travail

L'applicationId de votre tâche est donnée lorsque vous soumettez la tâche Spark. Vous pourrez voir cela dans la console où vous soumettez ou à partir de l'interface utilisateur Hadoop.

incapable d'exécuter 'x86_64-conda_cos6-linux-gnu-gcc' :aucun fichier ou répertoire de ce type (installation pysam)

Docker :Comment ajouter des backports à sources.list via Dockerfile ?

Linux

Comment rediriger stderr vers stdout dans Bash

Comment rediriger la sortie de la commande shell

Comment vérifier si un fichier est vide dans Bash ?

Comment rediriger la sortie de system() vers un fichier ?

Comment rediriger la sortie du programme comme son entrée

Comment rediriger la sortie d'une commande vers un fichier lorsque la commande demandera des entrées utilisateur ?