Grundlagen

Storage-Virtualisierung

In unserer Grundlagen-Rubrik erklären wir wichtige Aufgaben und Technologien aus dem Arbeitsalltag eines Netzwerk- und Systemadministrators. Hier erfahren Sie anhand prägnanter Erklärungen zu den wichtigsten Begriffen des jeweiligen Themenfeldes Hintergründe und Zusammenhänge in kompakter, praxisnaher Form.
Die Virtualisierung hat sich in den letzten Jahren zu einer der wichtigsten Technologien in der IT entwickelt. Wie bei der Server-Virtualisierung und der Desktop-Virtualisierung geht es auch bei der Storage-Virtualisierung primär darum, im Rechenzentrum für Konsolidierung zu sorgen und dem IT-Administrator in Zeiten rasanten Datenwachstums das Management der Speicherumgebung zu vereinfachen.

Grundsätzlich zeichnet sich die Storage-Virtualisierung durch die Trennung des logischen Speicherorts vom physikalischen Speicher aus. Die eingesetzte Virtualisierungslösung sorgt dann durch den Einsatz von Zuordnungstabellen (Mapping) dafür, dass Nutzer stets über die gleichen Pfade auf die benötigten Daten zugreifen können – unabhängig davon, auf welcher Festplatte oder welchem LUN die Informationen physikalisch liegen. Da in größeren Unternehmensnetzwerken meist ein Block-basiertes SAN zum Einsatz kommt, ist meist Blockvirtualisierung gemeint, wenn es um das Thema Speichervirtualisierung geht.

Blockvirtualisierung im SAN
Bei der Blockvirtualisierung speichert die Virtualisierungslösung die Blöcke aller Festplatten in einer Liste. Diese Tabelle wird auch als "Mapping Table" bezeichnet. Dieser ist zu entnehmen, wo genau sich ein bestimmter Datenblock befindet. Die physikalische Adresse dieses Datenblocks hält das Virtualisierungssystem anhand des "LUN Identifier" beziehungsweise der "Logical Block Address" fest. Durch diese Liste ist es möglich, logische Festplatten unabhängig vom Festplatten-Controller des Speichersystems zu verschieben, zu kopieren, zu spiegeln oder zu replizieren. Diese Adresstabellen werden auch Meta-Daten genannt und leiten einen I/O-Request zum tatsächlichen Speicherort der gesuchten Information weiter.

Hand in Hand mit der Blockvirtualisierung gehen einige Funktionen, die das Speichermanagement erleichtern sollen. So soll etwa Thin Provisioning die Auslastung des SAN verbessern, indem Nutzern oder Gruppen nur so viel Speicher zur Verfügung gestellt wird wie aktuell benötigt. Wachsen die Anforderungen an den Speicherplatz, lässt sich die zulässige Quote schnell und bei Bedarf automatisiert erhöhen. Zu den weiteren Möglichkeiten der Blockvirtualisierung zählt das sogenannte Pooling, das die Zusammenfassung unterschiedlicher Speichersysteme zu einem Storage-Pool erlaubt. Im Idealfall ist es auf diesem Weg möglich, auch heterogene Storage-Systeme als ein Speicher anzusprechen und unter einer gemeinsamen Oberfläche zu verwalten.

Vor- und Nachteile der Blockvirtualisierung
Als ein Hauptvorteil der Blockvirtualisierung gilt die Möglichkeit, virtualisierte Daten problemlos und für den Nutzer unsichtbar verschieben und migrieren zu können. Ändert sich der physikalische Speicherort eines Blocks, wird dies lediglich in der Mapping Table vermerkt. Der Host, der auf diese Adressliste zugreift, muss aber nicht über die veränderte physikalische Position der Daten informiert werden, da er im Rahmen der I/O-Redirection anhand der Metadaten automatisch zum korrekten Speicherort geleitet wird.

Als weiterer Pluspunkt der Blockvirtualisierung ist die verbesserte Auslastung der Kapazitäten zu sehen. Da sich Speicherplatz etwa durch Thin Provisioning quasi ad hoc und dem Bedarf angepasst zuteilen lässt, wird der Überprovisionierung wirksam ein Riegel vorgeschoben. Befürworter der Blockvirtualisierung führen zudem an, dass sich durch eine einheitliche Virtualisierungsschicht auch heterogene Speichersysteme gemeinsam verwalten lassen und es so zu einer deutlichen Storage-Administration kommt.

Als Nachteile der Blockvirtualisierung wird oft die gestiegene Komplexität genannt, die vor allem durch das Generieren und Verwalten von Meta-Daten entsteht. Da nur die Virtualisierungslösung weiß, wo genau sich die gesuchten Blöcke befinden, wird diese zum Single Point of Failure. Außerdem kann es zu Performance-Problemen kommen – durch den zusätzlichen Overhead beim Verarbeiten der Metadaten kann es zu Engpässen bei der I/O-Redirection kommen, die das gesamte Speichersystem verlangsamen. Außerdem mahnen Kritiker der Blockvirtualisierung an, dass sich durch eine gemeinsame Virtualisierungsschicht heterogene Systeme nur in der Theorie gemeinsam verwalten ließen und proprietäre Produkte der Hersteller zur Speichervirtualisierung eben nicht konvergent wären.

Wege zur Blockvirtualisierung
Zur praktischen Umsetzung der Blockvirtualisierung im SAN existieren drei mögliche Wege, die jeweils spezifische Vor- und Nachteile haben.

  • Bei der Host-basierten Virtualisierung sorgt eine Software direkt auf dem Host für das I/O-Mapping und das korrekte Umsetzen der Metadaten. Als Vorteil dieses Ansatzes gilt, dass dieser relativ leicht zu implementieren ist und mit jeder Art Storage zusammenarbeitet. Als deutlicher Nachteil ist zu vermerken, dass sämtliche Vorteile der Blockvirtualisierung wie etwa die unbemerkte Datenmigration nur auf Basis des Hosts nutzbar sind, auf dem die Virtualisierungssoftware installiert ist und somit auch abhängig ist von der Kompatibilität mit dem jeweils eingesetzten Betriebssystem.

  • Die Storage-Device-basierte Virtualisierung bringt die Blockvirtualisierung direkt in das Speichergerät. Die Lokalisierung der physikalischen Speicherorte erfolgt also erst im Storage-Device selbst – bereits ein RAID-System stellt somit eine Art Device-basierte Speichervirtualisierung dar, da dem Nutzer nicht bekannt ist, auf welcher Festplatte die Daten tatsächlich liegen, er aber trotzdem mit den bereits genannten Vorteile der Speichervirtualisierung arbeiten kann. Nachteilig wirkt sich bei dieser Methode aus, dass der hierbei nötige Storage-Controller leicht zum Flaschenhals werden kann und eventuell nicht mit Controllern anderer Hersteller zusammenarbeitet.

  • Der heute gebräuchlichste Ansatz zur Virtualisierung wird als Netzwerk-basierte Virtualisierung bezeichnet. Hierbei sorgt eine Virtualisierungsappliance oder ein spezieller Switch dafür, dass die zugreifenden Hosts mit den korrekten Adresstabellen versorgt werden. Diese Methode gilt als vielversprechend wenn es darum geht, heterogene Systeme unter einem Storage-Management zu vereinen und über verschiedene Plattformen hinweg Daten zu migrieren oder replizieren. Als möglicher Nachteil ist jedoch wiederum der mögliche Performance-Engpass zu nennen sowie steigende Komplexität beim Einsatz in heterogenen Landschaften.
Dateivirtualisierung und Unified Storage
Analog zur Blockvirtualisierung lässt sich natürlich auch in File-basierten Storage-Systemen Virtualisierung betreiben. Auch hier wird eine Abstraktionsschicht zwischen Client und File-Server eingezogen, die dafür sorgt, dass der Zugriff auf Dateien unabhängig von deren physikalischem Speicherort erfolgen kann. Da unstrukturierte, File-basierte Daten stark im Anstieg sind, hält auch dieser Ansatz viel Potential zur Konsolidierung bereit. Durch eine globale Erfassung von Dateien und deren Strukturierung lässt sich etwa durch automatisches Tiering – die Zuweisung von Dateien zu unterschiedlich schnellen Speicherebenen – dafür sorgen, dass Nutzer auf wichtige Daten stets mit einer hohen Performance zugreifen können. Zudem stellt sich die unternehmensweite Suche nach bestimmten Dateien vereinfacht dar, wenn alle Files in einer Adresstabelle erfasst sind.

Im Rahmen der Speichervirtualisierung fällt zudem oder der Begriff Unified Storage. Bei diesem Ansatz geht es darum, Block- (SAN) und Datei-basierten Speicher (NAS) in einem System zu kombinieren und die Vorteile der Virtualisierung für beide Speicherarten nutzbar zu machen. Als Nebeneffekt zur Virtualisierung soll dies Administratoren entlasten, indem nicht mehrere Systeme mit spezifischen Protokollen, Kabelsystemen und einzigartigem Management-Interface zu warten sind. Auch hier aber sind wieder Performance-Problemen denkbar, wenn etwa systemkritische Datenbanken zusammen mit dem stetig wachsenden unstrukturierten Daten virtualisiert auf einer Maschine liegen.
23.05.2012/ln

Nachrichten

Mehr Sicherheit in OpenShift [10.08.2017]

Die Red Hat OpenShift Container Platform in Version 3.6 soll die Cloud-native Sicherheit und Applikationskonsistenz verbessern. Die Enterprise-Kubernetes-Plattform bietet dabei neue Container-Sicherheits- und Compliance-Features. Darüber hinaus hat Red Hat die Konsistenz von Applikationen und Services in Multi-Cloud-Umgebungen ausgebaut. [mehr]

Weg durch die Cloud-Vielfalt [19.07.2017]

Controlware erweitert das Lösungs- und Beratungsangebot um neue Data Center- und Cloud-Workshops. Diese richten sich an Unternehmen, die ihre Infrastrukturen im Zuge anstehender Migrationsprojekte modernisieren und um Cloud-basierte Anwendungen auszubauen. Ziel der Workshops ist es, frühzeitig die Weichen für einen erfolgreichen Cloud-Einsatz in den Firmen zu stellen. [mehr]

Virtueller VPN-Router [3.07.2017]

Tipps & Tools

Outlook-Portal mit Wiki [15.08.2017]

Wenn Sie Outlook zum größten Teil nur für den E-Mail-Verkehr nutzen, lassen Sie ein dessen Potenzial weitgehend links liegen. Für mehr Informationen rund um die Plattform kann ein Blick auf die Webseite von DocOutlook helfen. Diese ist in ein Wiki auf Lokeen eingegliedert und bietet neben guten Tipps und Tricks auch ein Forum sowie eine Sammlung relevanter Artikel. Weiterhin ist eine umfangreiche Linksammlung zu anderen Outlook-Quellen enthalten. [mehr]

Speicherpfad für Outlook-Anhänge anpassen [10.08.2017]

IT-Profis lassen sich ungern vom Betriebssystem einschränken. Ein Beispiel hierfür ist die unpraktische Vorschrift von Microsoft Outlook, das für das Abspeichern von Anhängen immer denselben Standard-Ordner in den Dokumentverzeichnissen eines Anwenders vorsieht. Mit einem kleinen Eingriff in die Registry können Sie den Speicherpfad aber auf einen anderen Ordner umleiten. [mehr]

Buchbesprechung

Datenschutz-Grundverordnung

von Niko Härting

Anzeigen