Bien que ce soit une question relativement ancienne, la réponse est toujours la même. Vous avez une machine virtuelle (exécutée sur un hôte physique) et une sorte de stockage (soit un stockage partagé - un SAN FC, un stockage iSCSI, un partage NFS - ou un stockage local).
Avec la virtualisation, de nombreuses machines virtuelles tentent d'accéder aux mêmes ressources physiques en même temps. En raison de limitations physiques (nombre d'opérations de lecture/écriture - IOPS ; débit ; latence), il peut être difficile de satisfaire toutes les demandes de stockage de toutes les machines physiques en même temps. Ce qui se passe généralement :vous pourrez voir les "tentatives SCSI" et les opérations SCSI ayant échoué dans les systèmes d'exploitation de vos machines virtuelles. Si vous obtenez trop d'erreurs/tentatives dans un certain laps de temps, le noyau définira les systèmes de fichiers montés en lecture seule afin d'éviter d'endommager le système de fichiers.
Pour faire court :votre stockage physique n'est pas assez « puissant ». Trop de processus (machines virtuelles) accèdent au système de stockage en même temps, vos machines virtuelles n'obtiennent pas la réponse du stockage assez rapidement et le système de fichiers passe en lecture seule.
Il n'y a pas énormément de choses que vous pouvez faire. La solution évidente est un stockage amélioré/supplémentaire. Vous pouvez également modifier les paramètres des délais d'attente SCSI dans le noyau Linux. Les détails sont décrits, par exemple, dans :
http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1009465
http://www.cyberciti.biz/tips/vmware-esx-server-scsi-timeout-for-linux-guest.html
Cependant, cela ne fera que "retarder" vos problèmes, car le noyau n'aura que plus de temps avant que le système de fichiers ne soit défini en lecture seule. (C'est-à-dire que vous ne résolvez pas la cause du problème.)
Mon expérience (plusieurs années avec VMware) est que ce problème n'existe qu'avec les noyaux Linux (nous utilisons RHEL et SLES) et non avec les serveurs Windows. De plus, ce problème se produit sur toutes sortes de stockage - FC, iSCSI, stockage local. Pour nous, le composant le plus critique (et le plus cher) de notre infrastructure virtuelle est le stockage. (Nous utilisons désormais HP LeftHand avec des connexions iSCSI de 1 Gbit/s, et nous n'avons rencontré aucun problème de stockage depuis. Nous avons choisi LeftHand (plutôt que les solutions FC traditionnelles) pour son évolutivité.
Une explication probable est qu'il y a un problème matériel (défaillance partielle du disque) et que le noyau a remonté le système de fichiers racine en lecture seule dès qu'il a détecté le problème, afin de minimiser le problème. Un moyen plus fiable¹ de vérifier les options de montage actuelles est cat /proc/mounts
(grep ' / ' /proc/mounts
pour le système de fichiers racine, ignorez un rootfs / …
ligne qui est un artefact du processus de démarrage). Vous trouverez probablement que rw,errors=remount-ro
est devenu ro
(d'autres options peuvent être affichées en plus).
Les journaux du noyau contiennent probablement le message Remounting filesystem read-only
, précédé d'erreurs d'accès au disque. Les journaux vivent normalement en /var/log/kern.log
, cependant, s'il s'agit d'un système de fichiers désormais en lecture seule, le message n'y apparaîtra pas, bien que les erreurs précédentes le devraient. Vous pouvez également voir les dernières erreurs du noyau avec le dmesg
commande.
En aparté, sous Ubuntu, l'emplacement habituel des points de montage (utilisés par l'interface de bureau) est sous /media
(par exemple /media/cdrom0
), bien que vous puissiez utiliser /mnt
ou /mnt/cdrom
si vous le souhaitez.
¹ mount
rapports de /etc/mtab
. Si le système de fichiers racine est en lecture seule, /etc/mtab
ne peut pas être tenu à jour.
Ce qui s'est passé, c'est qu'il y a eu une panne de courant dans le centre de données récemment. Depuis, je n'ai plus touché à mon serveur. Une fois que notre centre de données perd de l'alimentation, VSphere rend le système de fichiers d'Ubuntu en lecture seule jusqu'à ce qu'il soit redémarré. J'aurais essayé de redémarrer mais je ne voulais pas que toute la surveillance devienne folle. J'ai fait taire Nagios (service de surveillance) et tout fonctionne bien maintenant que j'ai redémarré le système. Merci pour toutes les contributions. C'est très apprécié.