Lesezeit
2 Minuten
Seite 2 - Hochverfügbare Systeme ausfallsicher überwachen
Besondere Aufmerksamkeit für virtuelle Systeme
Bei der Realisierung hochverfügbarer Systeme setzen Unternehmen aus Kosten- und Effizienzgründen oft auf virtuelle Umgebungen. Dadurch lässt sich verteilte und nicht optimal genutzte Hardware konsolidieren, um allen Mitarbeitern auf einem zentralen und rechenstarken Host alle Anwendungen kosteneffizient und wartungsoptimal zur Verfügung zu stellen. Dies birgt jedoch eine große Gefahr: Durch die Konsolidierung auf zentrale Hardware werden Single-Points-of-Failure (SPoF) geschaffen. Eine Hard- oder Softwarestörung oder eine Überlastung in der Netzwerkanbindung der virtuellen Hostserver hat in diesem Szenario wesentlich gravierendere Auswirkungen als in einer herkömmlichen Infrastruktur mit relativ unabhängigen Clients und einer verteilten Datenablage. Durch die deshalb notwendige Bereitstellung redundanter Ressourcen wird das IT-System komplexer.
Die Wichtigkeit eines lückenlosen Monitorings steigt in solchen Umgebungen erheblich, und die Integration virtueller Maschinen in das Monitoring ist entscheidend. Bei der Planung der Redundanzen ist es eine große Herausforderung, dafür zu sorgen, dass bei einem Ausfall eines Servers der Ressourcenbedarf der Nutzer auch tatsächlich von den restlichen Systemen gedeckt werden kann. Dabei können historische Monitoring-Daten helfen, die Lastspitzen der vergangenen Monate übersichtlich darzustellen und die Auslastung der Systeme transparent zu machen. Findige Netzwerkverantwortliche können auf Basis solcher Daten virtuelle Server so planen, dass während des Normalbetriebs überschüssige Ressourcen zur weiteren Performancesteigerung genutzt werden, während gleichzeitig bei einem Ausfall von Servern noch genügend Leistung zur Verfügung steht, um einen reibungslosen Geschäftsbetrieb zu sichern.
Bild 2: Jede Applikation befindet sich zunächst auf einem eigenen physikalischen Server mit angeschlossenem Speicher (oben). In der virtuellen Umgebung teilen sich drei Anwendungen die Ressourcen eines virtuellen Servers (unten).
Hochverfügbares Netzwerk-Monitoring durch Failover-Clustering
Was für die übrige IT-Infrastruktur gilt, kann auch für das Netzwerk-Monitoring von Bedeutung sein. Eine Netzwerk-Monitoring-Lösung sollte deshalb selbst die Option zur Hochverfügbarkeit bieten, zum Beispiel durch das Implementieren eines Failover-Clusters. Eine solche Lösung stellt sicher, dass die Monitoring-Daten genauso lückenlos verfügbar sind wie das überwachte IT-Netzwerk selbst. Eine Beeinträchtigung der Betriebszeit des Monitorings beispielsweise durch Verbindungsstörungen, einen Ausfall der Internetanbindung oder fehlerhafte Hardware sowie Software-Upgrades wird dadurch vermieden. Selbst bei einem Crash des Hauptservers läuft das Monitoring auf anderen Knoten des Clusters ganz normal weiter. Die Paessler AG zum Beispiel setzt bei ihrer Monitoring-Software einen Cluster mit einem Master sowie bis zu vier Failover Nodes ein.
Vorteile der Netzwerküberwachung mit einem Failover-Cluster
Während des regulären Betriebs der Netzwerk-Monitoring-Lösung wird der Master Node genutzt, um Geräte und Sensoren zu konfigurieren. Dieser verteilt die Konfiguration automatisch an alle anderen Knoten, die über bi-direktionale IP-Verbindungen miteinander in ständigem Kontakt stehen. Fällt der Master Node aus, übernimmt automatisch einer der Failover Nodes dessen Aufgaben und sorgt durch ein intelligentes internes Management dafür, dass Benachrichtigungen und Monitoring-Daten unterbrechungsfrei zur Verfügung stehen.
Bild 3: Das Vier-Knoten-Szenario zeigt einen Cluster Node, der aktuell nicht mit dem Cluster verbunden ist
Die Entwickler von Paessler haben für das Failover-Cluster der PRTG Network Monitor Lösung ein besonderes Herangehen gewählt: Die Failover-Nodes stehen nicht nur reaktiv für den Fehlerfall bereit, sondern sammeln fortlaufend ihre eigenen Daten, wodurch als zusätzlicher Nutzen Monitoring-Daten aus verschiedenen Perspektiven zur Verfügung stehen. So können beispielsweise Latenzzeiten für Serveranfragen aus verschiedenen Ländern überprüft und verglichen werden.
Für den Fall, dass ein oder mehrere Knoten Ausfälle oder Schwellenwertüberschreitungen erkennen, erhält der Administrator per E-Mail oder SMS eine zentrale Benachrichtigung. Mit dem Status "Down (Partial)" indiziert PRTG einen Ausfall, der nur von einigen Nodes im Cluster gemeldet wird. Damit kann der Administrator leicht feststellen, ob tatsächlich ein Dienst oder Gerät einen Fehler aufweist oder ob nur eine bestimmte Verbindung betroffen ist.
Fazit
Um Hochverfügbarkeit im Netzwerk zu gewährleisten, ist es unerlässlich, den Erfolg aller Maßnahmen durch ein kontinuierliches Netzwerk-Monitoring zu kontrollieren. Neben der reinen Verfügbarkeitsüberwachung können Monitoring-Daten ein Unternehmen bei der Planung zentraler Ressourcen unterstützten, um durch gezielte Investitionen Kosten einzusparen. Dazu ist eine Netzwerküberwachung essenziell, die gegebenenfalls mittels Failover-Clustering sich selbst absichert und es dem Netzwerkverantwortlichen ermöglicht, die Hochverfügbarkeit seines gesamten Netzwerks sicherzustellen.
ln/Daniel Zobel, Leiter Technische Dokumentation Paessler AG
Bei der Realisierung hochverfügbarer Systeme setzen Unternehmen aus Kosten- und Effizienzgründen oft auf virtuelle Umgebungen. Dadurch lässt sich verteilte und nicht optimal genutzte Hardware konsolidieren, um allen Mitarbeitern auf einem zentralen und rechenstarken Host alle Anwendungen kosteneffizient und wartungsoptimal zur Verfügung zu stellen. Dies birgt jedoch eine große Gefahr: Durch die Konsolidierung auf zentrale Hardware werden Single-Points-of-Failure (SPoF) geschaffen. Eine Hard- oder Softwarestörung oder eine Überlastung in der Netzwerkanbindung der virtuellen Hostserver hat in diesem Szenario wesentlich gravierendere Auswirkungen als in einer herkömmlichen Infrastruktur mit relativ unabhängigen Clients und einer verteilten Datenablage. Durch die deshalb notwendige Bereitstellung redundanter Ressourcen wird das IT-System komplexer.
Die Wichtigkeit eines lückenlosen Monitorings steigt in solchen Umgebungen erheblich, und die Integration virtueller Maschinen in das Monitoring ist entscheidend. Bei der Planung der Redundanzen ist es eine große Herausforderung, dafür zu sorgen, dass bei einem Ausfall eines Servers der Ressourcenbedarf der Nutzer auch tatsächlich von den restlichen Systemen gedeckt werden kann. Dabei können historische Monitoring-Daten helfen, die Lastspitzen der vergangenen Monate übersichtlich darzustellen und die Auslastung der Systeme transparent zu machen. Findige Netzwerkverantwortliche können auf Basis solcher Daten virtuelle Server so planen, dass während des Normalbetriebs überschüssige Ressourcen zur weiteren Performancesteigerung genutzt werden, während gleichzeitig bei einem Ausfall von Servern noch genügend Leistung zur Verfügung steht, um einen reibungslosen Geschäftsbetrieb zu sichern.
Bild 2: Jede Applikation befindet sich zunächst auf einem eigenen physikalischen Server mit angeschlossenem Speicher (oben). In der virtuellen Umgebung teilen sich drei Anwendungen die Ressourcen eines virtuellen Servers (unten).
Hochverfügbares Netzwerk-Monitoring durch Failover-Clustering
Was für die übrige IT-Infrastruktur gilt, kann auch für das Netzwerk-Monitoring von Bedeutung sein. Eine Netzwerk-Monitoring-Lösung sollte deshalb selbst die Option zur Hochverfügbarkeit bieten, zum Beispiel durch das Implementieren eines Failover-Clusters. Eine solche Lösung stellt sicher, dass die Monitoring-Daten genauso lückenlos verfügbar sind wie das überwachte IT-Netzwerk selbst. Eine Beeinträchtigung der Betriebszeit des Monitorings beispielsweise durch Verbindungsstörungen, einen Ausfall der Internetanbindung oder fehlerhafte Hardware sowie Software-Upgrades wird dadurch vermieden. Selbst bei einem Crash des Hauptservers läuft das Monitoring auf anderen Knoten des Clusters ganz normal weiter. Die Paessler AG zum Beispiel setzt bei ihrer Monitoring-Software einen Cluster mit einem Master sowie bis zu vier Failover Nodes ein.
Vorteile der Netzwerküberwachung mit einem Failover-Cluster
Während des regulären Betriebs der Netzwerk-Monitoring-Lösung wird der Master Node genutzt, um Geräte und Sensoren zu konfigurieren. Dieser verteilt die Konfiguration automatisch an alle anderen Knoten, die über bi-direktionale IP-Verbindungen miteinander in ständigem Kontakt stehen. Fällt der Master Node aus, übernimmt automatisch einer der Failover Nodes dessen Aufgaben und sorgt durch ein intelligentes internes Management dafür, dass Benachrichtigungen und Monitoring-Daten unterbrechungsfrei zur Verfügung stehen.
Bild 3: Das Vier-Knoten-Szenario zeigt einen Cluster Node, der aktuell nicht mit dem Cluster verbunden ist
Die Entwickler von Paessler haben für das Failover-Cluster der PRTG Network Monitor Lösung ein besonderes Herangehen gewählt: Die Failover-Nodes stehen nicht nur reaktiv für den Fehlerfall bereit, sondern sammeln fortlaufend ihre eigenen Daten, wodurch als zusätzlicher Nutzen Monitoring-Daten aus verschiedenen Perspektiven zur Verfügung stehen. So können beispielsweise Latenzzeiten für Serveranfragen aus verschiedenen Ländern überprüft und verglichen werden.
Für den Fall, dass ein oder mehrere Knoten Ausfälle oder Schwellenwertüberschreitungen erkennen, erhält der Administrator per E-Mail oder SMS eine zentrale Benachrichtigung. Mit dem Status "Down (Partial)" indiziert PRTG einen Ausfall, der nur von einigen Nodes im Cluster gemeldet wird. Damit kann der Administrator leicht feststellen, ob tatsächlich ein Dienst oder Gerät einen Fehler aufweist oder ob nur eine bestimmte Verbindung betroffen ist.
Fazit
Um Hochverfügbarkeit im Netzwerk zu gewährleisten, ist es unerlässlich, den Erfolg aller Maßnahmen durch ein kontinuierliches Netzwerk-Monitoring zu kontrollieren. Neben der reinen Verfügbarkeitsüberwachung können Monitoring-Daten ein Unternehmen bei der Planung zentraler Ressourcen unterstützten, um durch gezielte Investitionen Kosten einzusparen. Dazu ist eine Netzwerküberwachung essenziell, die gegebenenfalls mittels Failover-Clustering sich selbst absichert und es dem Netzwerkverantwortlichen ermöglicht, die Hochverfügbarkeit seines gesamten Netzwerks sicherzustellen.
<<Vorherige Seite Seite 2 von 2
ln/Daniel Zobel, Leiter Technische Dokumentation Paessler AG