Deutlich größere Herausforderungen ergeben sich bei den "unstrukturierten" Daten, und hier sehen sich die IT-Abteilungen mit einem immensen Datenwachstum und einer enormen Vielfalt konfrontiert. Das Spektrum reicht von E-Mails und Instant Messages über PDFs und Office-Dokumente jeder Art bis zu Audio- und Videofiles. Einen Brennpunkt bilden E-Mail-Programme und insbesondere die Attachments jeder Art.
Eine weitere Ursache für das rasante Wachstum unstrukturierter Datenbestände ist der technische Fortschritt. Im medizinischen Bereich beispielsweise steigen die Auflösungen der Röntgenbilder stetig an. Auch werden zunehmend Videos im Gesundheitswesen erstellt, die dann archiviert werden müssen. Behörden, die früher ganz normale Flurkarten aufbewahren mussten, sehen sich heute mit 3D-Überflugsdaten konfrontiert, die adäquat aufbewahrt und gesichert werden müssen. Eine Möglichkeit, die unstrukturierten Daten in den Griff zu bekommen, bietet die objektorientierte Speicherung und Verwaltung in Form horizontaler Applikationen etwa für E-Mails und Dokumentenmanagement. Dazu kommen branchenspezifische Applikationen zum Beispiel für das Gesundheitswesen oder den öffentlichen Sektor.
Zentralisierung der Storage-Umgebungen soll Datenflut bändigen
Zur Bewältigung der Datenflut haben viele Unternehmen in den letzten Jahren ein Storage Area Network (SAN) aufgebaut, das Server- und Speichersystem über dedizierte Kommunikationskanäle miteinander verbindet. Im Kern geht es dabei um eine Abkehr von einer dezentralen Storage-Umgebung (DAS = Direct Attached Storage) hin zu einem zentralen Storage-System, einschließlich aller damit verbundenen Aufgaben wie Management der Auslastung, Backup und Recovery und so weiter. Im Alltag zeigte sich allerdings schon bald, dass die erste Generation relativ "unintelligenter" SANs nur bedingt eine Lösung darstellt. Die Daten sind nun zwar zentral abgelegt, aber das Wachstum geht unvermindert weiter. Nun ist es an der Zeit, sich über die Struktur der Daten Gedanken zu machen, denn damit befassen sich klassische SANs von Haus aus nicht.
Storage Tiering, also die Verwendung von heterogenen "Plattentechnologien" in einem Array, war der erste Ansatz. Dabei werden Eingabe-/Ausgabe-intensive Operationen wie Online-Transaktionsverarbeitung (OLTP) oder Anwendungen mit häufigem Webzugriff auf schnelle Speichermedien wie leistungsfähige Solid-State-Disks (SSDs) oder SAS-Festplatten geleitet. Selten benötigte Daten kommen auf kostengünstige SATA- oder NL-SAS-Speichermedien. Lange Zeit war diese Methode des Storage Tiering auf die Verwendung unterschiedlicher Speicher-Volumes beschränkt. Heute kommt sie auch innerhalb eines Volumes zum Einsatz. Administratoren können damit "wichtige" Daten auf schnellen Platten ablegen und "unwichtige" auf langsame Platten mit hoher Kapazität. Insbesondere durch den Einsatz von SSDs steht ein sehr schnelles Medium zur Verfügung.Eine entscheidende Frage steht aber immer noch im Raum: Wann sind welche Daten "wichtig"? Nur wenn diese Frage beantwortet wird, lässt sich entscheiden, wo welche Daten untergebracht werden. Anders formuliert ist Storage Tiering lediglich eine Methode der Verteilung. Wie sie genutzt wird, überließ man bislang dem Anwender.
Automatisches Storage Tiering
Benötigt werden Storage-Systeme, die neben dem Tiering auch noch Funktionen zur Automatisierung bereitstellen. Lösungen, wie beispielweise die Dell-Compellent-Systeme, verfügen sowohl über ein automatisches als auch ein dynamisches Storage Tiering. Die Compellent-Storage-Systeme bieten zudem ein hochgradig virtuelles Tiering. Daten werden generell "schnell" geschrieben und dann ihrer Bedeutung nach auf günstigere Medien verlegt. Dabei agiert das System sehr granular.
"Schnell" schreiben umfasst hier drei Aspekte: Erstens wird auf ein schnelles Medium geschrieben, etwa auf eine SAS-Festplatte mit einer Umdrehungsgeschwindigkeit von 15.000 U/min. Zweitens kommt das schnelle RAID-Level 10 (ein RAID 0 über mehrere RAID 1) zum Einsatz, das Sicherheit mit einer hohen Schreib-/Lesegeschwindigkeit kombiniert. Drittens schreibt das System zunächst nur auf die äußeren Bereiche der Platte, die sich, gemessen am Schreib-Lesekopf, am schnellsten drehen. Somit ergibt sich schon im Tier 1 eine dreifache Granularität, Daten zuzuweisen. Sinkt die "Wichtigkeit", ändert das System den Raid Level von 10 auf 5 und es werden Kapazitäten frei. Neben dem Tier 1 mit den schnellen SAS-Festplatten werden auch nachgelagerte Tiers bedient, wenn die Daten nicht mehr ständig benötigt werden und somit "erkaltet" sind.
Seite 1 von 2 Nächste Seite>>





