Fachartikel

Monitoring, Backup und Recovery in virtualisierten Umgebungen (2)

Beim Betrieb einer Virtualisierungsinfrastruktur müssen IT-Verantwortliche auch dafür sorgen, dass die Umgebung verfügbar ist und im Fehlerfall schnell und ohne Datenverluste wieder anläuft. Hier kommen Monitoring, Backup, Ausfallsicherheit und Desaster-Recovery-Strategien ins Spiel. In der zweiten Folge des Workshops gehen wir darauf ein, warum USV-Systeme Pflicht sind, wie Sie beim Storage auf IOPs und Latenz achten und warum Sie beim Monitoringauch Temperatur und Wasser erfassen sollten.
Nie ohne Sprungtuch – auch in virtualisierten Umgebungen sollten Sie für alle Fälle gewappnet sein.
USV ist Pflicht bei der Stromversorgung
Neben der Technik benötigen Sie auch eine gute, zuverlässige und konstante Stromversorgung. Wir haben in Deutschland zwar ein sehr stabiles Stromnetz, trotzdem kann es immer mal zu einem Ausfall oder einer geplanten Downtime kommen, zum Beispiel wenn Zähler oder andere Komponenten getauscht werden müssen. Unterbrechungsfreie Stromversorgungen (USV-Systeme) gehören zum absoluten Standard in Firmen, darüber hinaus entscheidet die Höhe der Abhängigkeit von den Systeme, ob Sie weitere Maßnahmen ergreifen müssen.

So stehen optional Dieselgeneratoren bereit, die bei einem Ausfall von mehr als einigen Minuten einspringen und die EDV-Systeme mit Strom versorgen. Ob eine solche Verfügbarkeit benötigt wird, lässt sich nicht pauschal beantworten. Sie sollten jedoch das Thema Stromversorgung und Verfügbarkeit, vor allem mit Blick auf die möglichen Kosten, in Ruhe betrachten und entsprechend den Anforderungen umsetzen. Eine USV mit ausreichend Kapazität ist ein absolutes Muss, alles andere darüber hinaus kann, muss aber nicht. Stellen Sie sich die Frage, wie viele Mitarbeiter noch arbeiten können, wenn das Datacenter noch Strom hat, das gesamte restliche Gebäude aber nicht mehr.
Erhöhen der Verfügbarkeit durch Guest Clustering
Gerade in der Microsoft-Welt gibt es mittlerweile viele Dienste und Produkte, die sich redundant beziehungsweise hochverfügbar betreiben lassen. Dies muss nicht zwangsläufig eine SQL-Server-Enterprise-Installation sein, schon ein zweiter Domaincontroller sorgt dafür, dass ein zusätzlicher Anmelde- und DNS-Server in der Umgebung zur Verfügung steht. Der Microsoft-DHCP-Dienst erlaubt seit einiger Zeit, einen Partner einzutragen, der parallel in Absprache mit dem primären System oder als Fallback-Server IP-Adressen an Ihre Systeme und Clients verteilen kann (übrigens eine super Sache, schauen Sie sich diese Möglichkeit unbedingt einmal an). Durch die Installation eines File-Server-Clusters haben Sie die Möglichkeit, einzelne Cluster-Knoten in den Wartungsmodus zu versetzen, mit Updates zu versehen und neu zu starten.

Bei all diesen Aufbauten können Sie die virtuellen Server in zwei oder mehr Clustern betreiben. Diese Art von Aufbau nennt sich "Guest Cluster" und führt dazu, dass selbst bei dem Ausfall eines kompletten Hypervisor-Clusters immer noch ein Teil des Applikationsclusters zur Verfügung steht und es nicht zu einer vollständigen Downtime kommt.

Monitoring des Hypervisors
Schon bei einer sehr geringen Größe der IT-Landschaft ist es nahezu unmöglich, alle Systeme im Überblick zu behalten. Bei dieser Aufgabe helfen Ihnen Programme, die sich auf eine Überwachung der Infrastruktur spezialisiert haben. Die Auswahl der Programme reicht von kleinen Helfern, die ganz simpel ein System per Ping kontaktieren bis hin zu Aufbauten, die sich sämtliche Daten einverleiben, diese auswerten und sogar Anomalien feststellen, zum Beispiel eine unnatürlich hohe Latenz auf einer VPN-Strecke oder eine schlechtere Schreibleistung im Storage als in den vergangenen Tagen und Wochen.

Je mehr Daten Sie über Ihre Infrastruktur sammeln und je besser diese ausgewertet werden, desto eher finden Sie mögliche Engpässe oder die Ursache für Probleme. Beim Betrieb einer Hypervisor-Infrastruktur gibt es einige Werte, bei denen eine generelle Überwachung sinnvoll ist, da Engpässe bei diesen Werten in nahezu allen Fällen zu spürbaren Problemen führt.

Überwachen Sie Ihre Hardware-Hypervisoren, sollten Sie hier im ersten Schritt die allseits bekannten Performancewerte für die CPU, die Auslastung des Arbeitsspeichers und den Füllstand der lokalen Datenträger im Blick behalten. Eine Überwachung der Netzwerkschnittstellen sorgt dafür, dass Sie die Bandbreiten, Latenzen, mögliche Paketfehler und natürlich komplette Ausfälle erkennen. Ist Ihre Storage per IP angebunden, sehen Sie durch ein Monitoring auch hier die Durchsätze und können erkennen, ob Lastspitzen im Tagesverlauf dafür sorgen, dass sämtliche zur Verfügung stehende Bandbreite aufgebraucht wird und Sie die Netzwerkleistung erhöhen sollten.

Wenn Sie mehrere Systeme in einem HA-Verbund betreiben, kann eine gute Software Ihnen immer sofort melden, wenn Sie mehr Gesamtressourcen nutzen als ein System oder eine Site Ihres Cluster allein stemmen kann.

Seite 2: Im Storage auf IOP und Latenz achten



Seite 1 von 2 Nächste Seite >>
12.04.2021/jp/ln/Jan Kappen

Nachrichten

Zerto für Kubernetes erhältlich [21.04.2021]

Zerto hat die Verfügbarkeit von Zerto for Kubernetes (Z4K) bekanntgegeben und eine Vorschau auf Zerto 9.0 präsentiert. Z4K wendet Zertos Continuous-Data-Protection-Technologie auf containerisierte Anwendungen an und soll damit eine neue Sichtweise für die Sicherung und Notfallwiederherstellung von Anwendungen und Daten über Infrastrukturen in Cloud- und On-Premises hinweg bieten. [mehr]

Dell trennt sich von VMware [15.04.2021]

Nach gut 17 Jahren wird VMware offenbar wieder zu einem eigenständigen Unternehmen. Dell, das knapp 81 Prozent an VMware hält, will sich im vierten Quartal dieses Jahres von seiner Beteiligung trennen. Dadurch hofft das Unternehmen auf knapp 10 Milliarden US-Dollar, um so unter anderem bestehende Schulden zu tilgen. [mehr]

Tipps & Tools

Benutzerrollen in Microsoft Teams verwalten [4.04.2021]

Microsoft Teams gehört derzeit zu den am meisten verwendeten Diensten in Microsoft 365. Auch hierfür gibt es verschiedene Benutzerrollen. Unser Tipp erklärt die wichtigsten Gruppen für die Verwaltung und Delegierung von Microsoft Teams und zeigt anhand eines Beispiels, wie Sie einem Benutzer eine Rolle zuweisen. [mehr]

OTRS Community Edition lebt als Fork weiter [25.03.2021]

Nach dem abrupten Aus der populären Community-Edition des Ticketsystems OTRS setzt sich ein neu formierter Zusammenschluss von IT-Dienstleistern für ihren Fortbestand ein. Konkret hat sich die OTTER Alliance auf die Fahne geschrieben, den OTRS-Fork Znuny weiterzuentwickeln. [mehr]

Buchbesprechung

Computernetze und Internet of Things

von Patrick-Benjamin Bök, Andreas Noack, Marcel Müller

Anzeigen