Fachartikel

Troubleshooting in virtualisierten Umgebungen

Fehlerbehebung gehört zu den elementarsten Techniken, die IT-Profis beherrschen sollten. Dennoch wird sie oft übersehen. Grund dafür ist meistens Zeitmangel, denn Troubleshooting – besonders in einer virtualisierten Infrastruktur – ist angesichts der Vielzahl der betroffenen Elemente und der zahlreichen Abstraktionsebenen besonders zeitaufwändig. Der Fachartikel geht auf die größten Herausforderungen bei der Fehlerbehebung in virtualisierten Umgebungen ein und gibt Tipps, wie sich IT-Experten besser vorbereiten können.
Mit geeigneten Werkzeugen und Best Practices lassen sich Probleme im Bereich der Virtualisierung effektiv eliminieren.
Leider ist die Bestimmung der Ursache eines Problems häufig zeitaufwändig. Technologien wie Cloud, Virtualisierung, hybride IT und hyperkonvergente Infrastrukturen haben die IT von Grund auf verändert. Dabei sind Fehlerbehebungen, die alle entsprechenden verteilten Systeme abdecken, heute unternehmenskritischer und komplexer als je zuvor.

Letzten Endes geht es bei der Suche nach der Ursache eines IT-Problems darum, die Fläche des Fehlersuchradius zu reduzieren. Stellen Sie sich einen Kreis vor, in dessen Mitte sich die Grundursache des Problems befindet. Um dorthin zu gelangen, müssen Sie den Radius für die Fehlerbehebung eingrenzen, um Fehlalarme und alle anderen Probleme zu vermeiden. Gleichzeitig sollten Sie für die Integration und parallele Bereitstellung der Anwendungsdienste sorgen.

Zeit ist für IT-Profis ein rares Luxusgut, und die Fehlerbehebung – besonders in einer virtualisierten Umgebung – ist angesichts der Vielzahl der betroffenen Elemente und Systeme und der zahlreichen Abstraktionsebenen häufig besonders zeitaufwändig. Daher neigen IT-Profis dazu, eher die Symptome eines übergeordneten Problems zu bekämpfen anstatt das Grundproblem zu beheben.

Fehlerbehebung in virtualisierten Umgebungen
Eine große Herausforderung für IT-Experten bei der Fehlerbehebung in virtualisierten Umgebungen ist die Vielzahl der Zuständigkeiten für den Fall, dass etwas schief läuft. Speziell die Virtualisierung stellt ein besonders komplexes Fehlerbehebungsszenario dar, da diese Technologie die Vernetzung, physische Server und auch abgeleitete Abstraktionen wie etwa softwaredefinierte Konstrukte und Richtlinien betrifft. Alle Teams, die für diese Bereiche verantwortlich sind, können in einem solchen Szenario involviert werden, was den Prozess häufig verkompliziert.

Ein Großteil der Unternehmen muss außerdem die zusätzliche Komplexität hybrider IT-Umgebungen bewältigen, in denen auch Cloudanbieter Teil der IT-Services sind. Bei Verwendung von Cloud-Serviceanbietern wie Microsoft Azure oder AWS haben die meisten Unternehmen über ihre Firewall hinaus nur eine begrenzte Sicht. Innerhalb der Firewall verfügen sie zwar über Transparenz und Kontrolle, aber darüber hinaus erschwert die mangelnde Kontrolle und Sichtbarkeit die Fehlersuche erheblich.

Ein echtes Problem ist die plattformübergreifende Fehlerbehebung. Da die verschiedenen Elemente einer IT-Umgebung immer stärker dezentralisiert sind sowie immer komplexer und immer isolierter werden, wird es für IT-Abteilungen immer schwieriger, durch die verschiedenen Schichten eines Anwendungs-Stacks durchzudringen und den Single Point of Truth zu finden.

Eine weitere große Herausforderung bei der Fehlerbehebung in virtualisierten Umgebungen ist es, angesichts der Vielzahl unterschiedlicher Überwachungstools, die innerhalb eines Unternehmens zum Einsatz kommen, einen Single Point of Truth herauszuarbeiten. Das "Rauschen" zu vieler Datenpunkte und Warnungen überlagert oft die Wahrnehmung der IT-Experten, sodass das eigentliche Problem (beziehungsweise das "Signal") angesichts dieser Informationsflut nur schwer zu lokalisieren ist.
Fehlerbehebungen im Zeitalter der hybriden IT
Es ist dringend notwendig, angesichts der Verlagerungen in die Cloud auf andere Techniken zu setzen und neue Denkweisen anzuwenden. Auch Anbieter von Überwachungslösungen sind jetzt dabei, sich hierauf einzustellen. Einige Lösungen verwenden Abrechnungszugangsdaten, um sicherzustellen, dass die Inventargenauigkeit von Anfang an gegeben ist. Auf diese Weise erhalten IT-Experten von ihrem Standort aus auch über ihre dezentrale Infrastruktur Transparenz. IT-Profis sollten auch dafür sorgen, dass sie im Rahmen der Fehlerbehebung Fehlerereignisse erhalten. Tools für die Aggregation von Protokollen – besonders cloudbasierte Protokolltools wie Papertrail – sind beim Debuggen virtueller Workloads besonders hilfreich.

Best Practices bei der Fehlerbehebung
Bei der Fehlerbehebung in virtualisierten Umgebungen kommen im Wesentlichen drei Methoden zur Anwendung. Bei der ersten werden aktive und proaktive Warnungen genutzt, um sich mehr Transparenz zu verschaffen und um ein Profil der Verhaltensweisen von Anwendungen zu erhalten. Beim Einsatz eines Überwachungstools besteht das Ziel darin, schnell den Bezugspunkt herauszuarbeiten, um auf diese Weise Schwellwerte für die Betriebsumgebung festzulegen und an die jeweiligen Umstände anzupassen. Auf diese Weise erhalten IT-Experten mehr Signale und weniger Warnungsrauschen.

Bei der zweiten Methode geht es darum, für die Fehlerbehebung vorhandene Wissensbestände und Best Practices zu nutzen. Wenn ein IT-Verantwortlicher dem Problem schon einmal begegnet ist und es dabei bereits behoben hat, kann er die damalige Vorgehensweise zum Standard für ähnliche Fälle machen. Alternativ dazu können IT-Experten auch ein Tool mit einem Empfehlungsmodul verwenden, um die entsprechende Wissenslücke in ihrer virtualisierten Umgebung zu füllen.

Häufig kommt es auch vor, dass IT-Profis es zum ersten Mal mit einem bestimmten Problem zu tun bekommen und nicht genügend Informationen für eine effektive Lösung haben. Hier kann die dritte Methode, nämlich die Verwendung von Zeitreihen-korrelierten Daten der wichtigsten Leistungsindikatoren über alle Stacks hinweg den Teams helfen, sich auf ihre Kompetenzbereiche zu konzentrieren. Dies stellt außerdem sicher, dass alle Teams auf dem gleichen Stand sind. Korrelierte Daten und Zusammenarbeit sind bei der Behebung von bisher unbekannten Virtualisierungsproblemen entscheidend.

Fehlerbehebungen erfordern geeignete Tools
Ein umfassendes IT-Überwachungs- und Verwaltungs-Tool – das Transparenz hinsichtlich eines gesamten Anwendungs-Stacks bietet – ist der Schlüssel, um diese Methoden zu optimieren und Probleme zu lösen, mit denen IT-Experten bei der Fehlerbehebung in virtuellen Umgebungen konfrontiert sind. Darüber hinaus können IT-Experten mit einem Überwachungstool wichtige Kennzahlen erfassen und korrelieren, relevante Schwellenwerte für Warnungen festlegen und sicherstellen, dass sie ihre Umgebung besser verstehen und kennen. Wenn ein Problem auftritt, lässt die Ursache effizient und effektiv ermitteln. Das letztendliche Ziel ist es, die Beeinträchtigungen der Endbenutzer auf ein Minimum zu reduzieren.

Fazit
Die größte Herausforderung bei der Fehlerbehebung in virtualisierten Umgebungen ist der Zeitmangel der IT-Experten. Aber mit diesen drei Fehlerbehebungsmethoden und mit umfassenden Tools zur IT-Überwachung, sind sie für die Herausforderungen, die noch vor ihnen liegen, gerüstet. Bei Verwendung eines geeigneten Überwachungstools zur Umsetzung der drei Fehlerbehebungsmethoden erhalten IT-Experten und ihre Teams die Daten, die sie für die Fehlerbehebung in jedem ihrer Stacks benötigen – egal ob diese lokal installiert sind oder sich dezentral in der Cloud befinden.
9.05.2018/ln/Kong Yang, Head Geek bei SolarWinds

Nachrichten

Gerüstet für den Datenansturm [20.09.2018]

D-Link präsentiert zwei neue Business Access Points, die auf dem aktuellen WLAN-Standard IEEE 802.11ac Wave 2 basieren. Der DWL-6620APS ist ein AC1300 Wave 2 Dualband Access Point mit spezieller D-Link Smart Antenna Technik für einen besseren Datendurchsatz und Abdeckung. Mit dem DWL-7620AP bereichert ein AC2200 Wave 2 Tri-Band Access Point das Portfolio des Herstellers. [mehr]

Mehr Leistung für UCC-Appliance [19.09.2018]

Starface hat die Hardware seiner UCC-Appliance 'STARFACE Advanced' neu aufgelegt. Das neue Modell verfügt nun über deutlich mehr Arbeitsspeicher und höhere Rechenleistung sowie neue Schnittstellen. [mehr]

Tipps & Tools

Dicke Objektrahmen entfernen [21.09.2018]

Unter Windows 10 kommt es gelegentlich vor, dass auf dem Desktop und in Programmen beziehungsweise im Explorer dicke Objektrahmen erscheinen. Dieser Missstand resultiert aus einer versehentlich aktivierten Sprachausgabe mit der Tastenkombination WIN+STRG+ENTER. Mit einem kleinen Eingriff im System lässt sich der Fehler beheben. [mehr]

Lernkarten zur Weiterbildung [20.09.2018]

Wenn Sie selbst eine Weiterbildung planen oder heranwachsenden Admins ein paar Nachhilfestunden geben wollen, kann die gute alte Karteikarte weiter helfen. Mit dem kostenfreien Tool 'Anki' lässt sich der Vorgang jetzt ganz praktisch digitalisieren. Das Karteikarten-Lernsystem beinhaltet eine Fülle von fertigen Lernkarten, die auch mobil genutzt werden können. Diese lassen sich auf Wunsch auch frei gestalten. [mehr]

Buchbesprechung

VoIP Praxisleitfaden

von Jörg Fischer und Christian Sailer

Anzeigen