Ausgangssituation
Ein Kunde meldet einen Stromausfall. Eine der Nodes war nicht an einer USV, ebenso der Switch.
Sowohl die NODE , als auch die Netzwerkverbindung sind ausgefallen. Der Switch ist wieder im Netzwerk aktiv und die NODE ist weiterhin aus. NODE02 ist aber nicht betroffen vom Ausfall.
Bestandsaufnahme mittels Failover-Cluster Manager:
Mehrere VM's down, nach Stromausfall auf einer NODE, warum?
Hier liegt der Fehler im Detail!
Bevor man also nun versucht die VM's zu starten, gehen wir den Failover Cluster Manager und DataCore durch!
NODE01 aus, NODE02 läuft. also kein Double Failure, oder komplett Aufall!
Disks sind alle online, also keine Gefahr der Daten!
Bestandsaufnahme mittels DataCore:
DataCore SANsymphony prüfen und starten
- DataCore Management Console öffnen
- Status der NODE prüfen
NODE02 war vom Ausfall nicht betroffen, also kann der DataCore Dienst wieder gestartet werden.
- NODE01 einschalten, ggf. über Remote-Management (iLO, iDRAC, IPMI).
- Prüfen, ob alle Systemplatten sauber eingebunden werden.
- Keine VMs starten, bevor die DataCore-Dienste laufen!
DataCore wird nun auf der NODE01 gestartet:
DataCore beginnt nun die NODE02 zu kontaktieren und beginnt das Full Log Recovery von alleine:
Im Failover Manager kann man nun die VM's wieder starten, wobei auch schön zu sehen ist, wie sie automatisch auf den "Best possible Node" verschoben werden.











0 Kommentare
Fügen Sie Ihren Kommentar hinzu