Grundlagen

Storage-Virtualisierung

In unserer Grundlagen-Rubrik erklären wir wichtige Aufgaben und Technologien aus dem Arbeitsalltag eines Netzwerk- und Systemadministrators. Hier erfahren Sie anhand prägnanter Erklärungen zu den wichtigsten Begriffen des jeweiligen Themenfeldes Hintergründe und Zusammenhänge in kompakter, praxisnaher Form.
Die Virtualisierung hat sich in den letzten Jahren zu einer der wichtigsten Technologien in der IT entwickelt. Wie bei der Server-Virtualisierung und der Desktop-Virtualisierung geht es auch bei der Storage-Virtualisierung primär darum, im Rechenzentrum für Konsolidierung zu sorgen und dem IT-Administrator in Zeiten rasanten Datenwachstums das Management der Speicherumgebung zu vereinfachen.

Grundsätzlich zeichnet sich die Storage-Virtualisierung durch die Trennung des logischen Speicherorts vom physikalischen Speicher aus. Die eingesetzte Virtualisierungslösung sorgt dann durch den Einsatz von Zuordnungstabellen (Mapping) dafür, dass Nutzer stets über die gleichen Pfade auf die benötigten Daten zugreifen können – unabhängig davon, auf welcher Festplatte oder welchem LUN die Informationen physikalisch liegen. Da in größeren Unternehmensnetzwerken meist ein Block-basiertes SAN zum Einsatz kommt, ist meist Blockvirtualisierung gemeint, wenn es um das Thema Speichervirtualisierung geht.

Blockvirtualisierung im SAN
Bei der Blockvirtualisierung speichert die Virtualisierungslösung die Blöcke aller Festplatten in einer Liste. Diese Tabelle wird auch als "Mapping Table" bezeichnet. Dieser ist zu entnehmen, wo genau sich ein bestimmter Datenblock befindet. Die physikalische Adresse dieses Datenblocks hält das Virtualisierungssystem anhand des "LUN Identifier" beziehungsweise der "Logical Block Address" fest. Durch diese Liste ist es möglich, logische Festplatten unabhängig vom Festplatten-Controller des Speichersystems zu verschieben, zu kopieren, zu spiegeln oder zu replizieren. Diese Adresstabellen werden auch Meta-Daten genannt und leiten einen I/O-Request zum tatsächlichen Speicherort der gesuchten Information weiter.

Hand in Hand mit der Blockvirtualisierung gehen einige Funktionen, die das Speichermanagement erleichtern sollen. So soll etwa Thin Provisioning die Auslastung des SAN verbessern, indem Nutzern oder Gruppen nur so viel Speicher zur Verfügung gestellt wird wie aktuell benötigt. Wachsen die Anforderungen an den Speicherplatz, lässt sich die zulässige Quote schnell und bei Bedarf automatisiert erhöhen. Zu den weiteren Möglichkeiten der Blockvirtualisierung zählt das sogenannte Pooling, das die Zusammenfassung unterschiedlicher Speichersysteme zu einem Storage-Pool erlaubt. Im Idealfall ist es auf diesem Weg möglich, auch heterogene Storage-Systeme als ein Speicher anzusprechen und unter einer gemeinsamen Oberfläche zu verwalten.

Vor- und Nachteile der Blockvirtualisierung
Als ein Hauptvorteil der Blockvirtualisierung gilt die Möglichkeit, virtualisierte Daten problemlos und für den Nutzer unsichtbar verschieben und migrieren zu können. Ändert sich der physikalische Speicherort eines Blocks, wird dies lediglich in der Mapping Table vermerkt. Der Host, der auf diese Adressliste zugreift, muss aber nicht über die veränderte physikalische Position der Daten informiert werden, da er im Rahmen der I/O-Redirection anhand der Metadaten automatisch zum korrekten Speicherort geleitet wird.

Als weiterer Pluspunkt der Blockvirtualisierung ist die verbesserte Auslastung der Kapazitäten zu sehen. Da sich Speicherplatz etwa durch Thin Provisioning quasi ad hoc und dem Bedarf angepasst zuteilen lässt, wird der Überprovisionierung wirksam ein Riegel vorgeschoben. Befürworter der Blockvirtualisierung führen zudem an, dass sich durch eine einheitliche Virtualisierungsschicht auch heterogene Speichersysteme gemeinsam verwalten lassen und es so zu einer deutlichen Storage-Administration kommt.

Als Nachteile der Blockvirtualisierung wird oft die gestiegene Komplexität genannt, die vor allem durch das Generieren und Verwalten von Meta-Daten entsteht. Da nur die Virtualisierungslösung weiß, wo genau sich die gesuchten Blöcke befinden, wird diese zum Single Point of Failure. Außerdem kann es zu Performance-Problemen kommen – durch den zusätzlichen Overhead beim Verarbeiten der Metadaten kann es zu Engpässen bei der I/O-Redirection kommen, die das gesamte Speichersystem verlangsamen. Außerdem mahnen Kritiker der Blockvirtualisierung an, dass sich durch eine gemeinsame Virtualisierungsschicht heterogene Systeme nur in der Theorie gemeinsam verwalten ließen und proprietäre Produkte der Hersteller zur Speichervirtualisierung eben nicht konvergent wären.

Wege zur Blockvirtualisierung
Zur praktischen Umsetzung der Blockvirtualisierung im SAN existieren drei mögliche Wege, die jeweils spezifische Vor- und Nachteile haben.

  • Bei der Host-basierten Virtualisierung sorgt eine Software direkt auf dem Host für das I/O-Mapping und das korrekte Umsetzen der Metadaten. Als Vorteil dieses Ansatzes gilt, dass dieser relativ leicht zu implementieren ist und mit jeder Art Storage zusammenarbeitet. Als deutlicher Nachteil ist zu vermerken, dass sämtliche Vorteile der Blockvirtualisierung wie etwa die unbemerkte Datenmigration nur auf Basis des Hosts nutzbar sind, auf dem die Virtualisierungssoftware installiert ist und somit auch abhängig ist von der Kompatibilität mit dem jeweils eingesetzten Betriebssystem.

  • Die Storage-Device-basierte Virtualisierung bringt die Blockvirtualisierung direkt in das Speichergerät. Die Lokalisierung der physikalischen Speicherorte erfolgt also erst im Storage-Device selbst – bereits ein RAID-System stellt somit eine Art Device-basierte Speichervirtualisierung dar, da dem Nutzer nicht bekannt ist, auf welcher Festplatte die Daten tatsächlich liegen, er aber trotzdem mit den bereits genannten Vorteile der Speichervirtualisierung arbeiten kann. Nachteilig wirkt sich bei dieser Methode aus, dass der hierbei nötige Storage-Controller leicht zum Flaschenhals werden kann und eventuell nicht mit Controllern anderer Hersteller zusammenarbeitet.

  • Der heute gebräuchlichste Ansatz zur Virtualisierung wird als Netzwerk-basierte Virtualisierung bezeichnet. Hierbei sorgt eine Virtualisierungsappliance oder ein spezieller Switch dafür, dass die zugreifenden Hosts mit den korrekten Adresstabellen versorgt werden. Diese Methode gilt als vielversprechend wenn es darum geht, heterogene Systeme unter einem Storage-Management zu vereinen und über verschiedene Plattformen hinweg Daten zu migrieren oder replizieren. Als möglicher Nachteil ist jedoch wiederum der mögliche Performance-Engpass zu nennen sowie steigende Komplexität beim Einsatz in heterogenen Landschaften.
Dateivirtualisierung und Unified Storage
Analog zur Blockvirtualisierung lässt sich natürlich auch in File-basierten Storage-Systemen Virtualisierung betreiben. Auch hier wird eine Abstraktionsschicht zwischen Client und File-Server eingezogen, die dafür sorgt, dass der Zugriff auf Dateien unabhängig von deren physikalischem Speicherort erfolgen kann. Da unstrukturierte, File-basierte Daten stark im Anstieg sind, hält auch dieser Ansatz viel Potential zur Konsolidierung bereit. Durch eine globale Erfassung von Dateien und deren Strukturierung lässt sich etwa durch automatisches Tiering – die Zuweisung von Dateien zu unterschiedlich schnellen Speicherebenen – dafür sorgen, dass Nutzer auf wichtige Daten stets mit einer hohen Performance zugreifen können. Zudem stellt sich die unternehmensweite Suche nach bestimmten Dateien vereinfacht dar, wenn alle Files in einer Adresstabelle erfasst sind.

Im Rahmen der Speichervirtualisierung fällt zudem oder der Begriff Unified Storage. Bei diesem Ansatz geht es darum, Block- (SAN) und Datei-basierten Speicher (NAS) in einem System zu kombinieren und die Vorteile der Virtualisierung für beide Speicherarten nutzbar zu machen. Als Nebeneffekt zur Virtualisierung soll dies Administratoren entlasten, indem nicht mehrere Systeme mit spezifischen Protokollen, Kabelsystemen und einzigartigem Management-Interface zu warten sind. Auch hier aber sind wieder Performance-Problemen denkbar, wenn etwa systemkritische Datenbanken zusammen mit dem stetig wachsenden unstrukturierten Daten virtualisiert auf einer Maschine liegen.
23.05.2012/ln

Nachrichten

Hyperkonvergenz aus einer Hand [22.06.2017]

Mit 'Red Hat Hyperconverged Infrastructure' kommt die laut Hersteller branchenweit erste Open-Source-basierte hyperkonvergente Infrastruktur-Lösung auf dem Markt. Die integrierte, Software-definierte Rechen- und Speicherplattform soll sich vor allem für den Einsatz in Filialen und Niederlassungen eignen. [mehr]

Container-as-a-Service von SUSE [20.06.2017]

SUSE bietet für die Anwendungsentwicklung und das Hosting von Container-basierten Anwendungen ab sofort die 'SUSE CaaS-Plattform' an. Das Werkzeug basiert auf einem speziell entwickelten Betriebssystem namens SUSE MicroOS, die Orchestrierung erfolgt über Kubernetes. Gerade im Bereich Konfiguration und Skalierung will der Hersteller mit dem neuen Produkt punkten. [mehr]

Tipps & Tools

Attachment-Vorschläge abstellen [29.06.2017]

Nicht jeder ist mit den immer mehr um sich greifenden automatisierten Abläufen in den neuesten Outlook-Versionen zufrieden. Vor allem die vorgeschlagende Liste der zuletzt verwendeten Dateien unter dem Outlook-Befehl 'Datei anfügen' kann nerven, wenn Sie in der Regel gezielt andere Anhänge benötigen. Mit einem kleinen Eingriff in die Registry können Sie diese Vorschläge limitieren oder ganz abschalten. [mehr]

E-Mails mit korrekter Rechtschreibung [28.06.2017]

Die Autokorrektur von Microsoft kann in vielen Fällen nicht alle Feinheiten eines Texts zur vollsten Zufriedenheit modifizieren. Wenn Sie ab und zu eine besonders wichtige E-Mail an externe Partner oder den eigenen Vorstand schicken müssen, lohnt sich ein zweiter Sicherheitspuffer für die Prüfung des Inhalts. Der Webdienst von 'online-spellcheck.com' bringt alle Vorteile und Funktionen einer Rechtschreibprüfung zusammen. [mehr]

Buchbesprechung

Datenschutz-Grundverordnung

von Niko Härting

Anzeigen