Depuis la version 3.17 du noyau Linux, les erreurs ECC sur E3 Xeon peuvent être surveillées à l'aide du ie31200_edac
pilote, introduit par ce commit. Cela utilise l'interface EDAC standard afin que les erreurs puissent être répertoriées à l'aide de edac-util
.
Un peu plus en détail :
sudo modprobe ie31200-edac
charge le pilote, ce qui se traduira par des lignes comme
[ 14.635299] EDAC MC: Ver: 3.0.0
[ 14.637898] EDAC MC0: Giving out device to module ie31200_edac controller IE31200: DEV 0000:00:00.0 (POLLED)
apparaissant dans le journal du noyau (c'est-à-dire sur un système C216 Haswell); alors
edac-util
signalera toute erreur.
Les contrôleurs de mémoire Xeon D, E5 et E7 sont pris en charge à l'aide du sb_edac
ou skx_edac
modules.