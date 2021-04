Monitoring, Backup und Recovery in virtualisierten Umgebungen (1)

Beim Betrieb einer Virtualisierungsinfrastruktur müssen IT-Verantwortliche auch dafür sorgen, dass die Umgebung verfügbar ist und im Fehlerfall schnell und ohne Datenverluste wieder anläuft. Hier kommen Monitoring, Backup, Ausfallsicherheit und Desaster-Recovery-Strategien ins Spiel. Im ersten Teil beschäftigen wir uns mit der Ausfallsicherheit von Servern, der Hochverfügbarkeit von Storage-Systemen und der Redundanz im Netzwerk.

Nie ohne Sprungtuch – auch in virtualisierten Umgebungen sollten Sie für alle Fälle gewappnet sein.

Ab einer gewissen Unternehmensgröße beginnen IT-Verantwortliche, an das Thema Hochverfügbarkeit zu denken. Ziel dieser Überlegung ist es in den meisten Fällen, den Ausfall einer Komponente, eines Servers oder eines ganzen Raums zu kompensieren, damit der Betrieb entweder vollständig ausfallfrei oder nur mit einer geringen Downtime handlungsfähig bleibt.



Der Aufbau einer Hochverfügbarkeit erstreckt sich nicht nur auf die virtuellen Server, sondern auch auf einige weitere Komponenten des IT-Betriebs, weshalb wir zunächst die gesamte Infrastruktur diesbezüglich betrachten. Dies wird zeigen, dass Hochverfügbarkeit nicht einfach durch einen zweiten Server erreicht wird, sondern dass zum Teil noch deutlich mehr dahintersteckt.



Ausfallsicherheit der Server

Der Aufbau eines Failover-Clusters beziehungsweise eines HA-Verbunds beginnt damit, dass Sie mehrere Server gleichzeitig betreiben. Diese Systeme sollten möglichst identisch sein, um die Administration und Pflege zu erleichtern. Alle Systeme in einem Cluster kümmern sich gemeinsam um den Betrieb von virtuellen Maschinen, dies können entweder Server- oder Clientsysteme sein – je nach Anforderungen. Betreiben Sie neben der Server- auch eine Clientvirtualisierung, kann es für Sie sinnvoll sein, einen zweiten Failover-Cluster aufzubauen, in dem nur die virtuellen Desktops laufen. Ab einer zweistelligen Anzahl an Hardwareknoten kann es ebenfalls von Vorteil sein, mehrere Cluster parallel zu betreiben. Dies erhöht zwar den administrativen Aufwand ein wenig, allerdings haben Sie bei einer Wartung oder einem Ausfall den Vorteil, dass nur ein Teil der Ressourcen nicht mehr zur Verfügung steht, und nicht der gesamte Cluster.



Alle Server in einem Failover-Cluster müssen mit einem gemeinsamen Storage kommunizieren können, auf dem die Daten der virtuellen Systeme abgelegt sind. Diese gemeinsame Verbindung sorgt dafür, dass bei einem Ausfall eines Cluster-Knotens ein anderes System die ausgefallenen VMs sofort wieder starten kann, sodass diese nach kurzer Zeit wieder betriebsbereit sind. Damit dieser Vorgang überhaupt möglich ist, müssen auf den verbleibenden Knoten noch ausreichend Ressourcen in Form von CPU und RAM zur Verfügung stehen.



Sie müssen daher definieren, wie viele Systeme gleichzeitig ausfallen dürfen. Haben Sie zwei Server, muss ein System allein den gesamten Workload betreiben können. Da jeder Knoten in gewissen Abständen nicht zur Verfügung steht (nämlich bei der Installation von Updates, je nach Hersteller einmal im Monat oder mehrmals im Jahr), muss das Partnersystem alle virtuellen Systeme in dieser Zeit betreiben können. Planen Sie mit mehr als zwei Systemen, kann sich theoretisch auch mehr als ein Server gleichzeitig in Wartung befinden. Sie sollten genau definieren, wie viele Server Sie benötigen, um die erforderliche Last inklusive des Wachstums in den kommenden Jahren zu bewältigen.



Sind die Server über mehrere Räume, Brandbereiche oder Gebäude verteilt, müssen Sie den Ausfall eines ganzen Bereichs abfangen können. Lassen Sie dies in Ihre Planung einfließen, ansonsten fällt Ihnen beim Ausfall von Bereich A auf, dass Bereich B überhaupt nicht in der Lage ist, den gesamten Workload alleine zu betreiben. Bei der Überwachung solcher Umgebungen helfen Ihnen professionelle Monitoringtools, auf die wir im weiteren Verlauf dieses Artikels noch zu sprechen kommen.