Fachartikel

Datenrettung bei Software-defined Storage

Die weltweiten Datenmengen sind enorm angewachsen. Immer mehr IoT-Geräte vernetzen sich und Firmen betreiben umfangreiches Data Mining, um noch mehr über die Kundenwünsche zu erfahren. Diese Informationsmasse auf physischem Speicher zu lagern, ist kaum noch kosteneffizient möglich. Abhilfe verspricht hier Software-defined Storage (SDS). Aber selbst dieser technologische Ansatz ist nicht vor Datenverlusten gefeilt. Der Artikel erklärt, Wie Sie sich vor einem Datenverlust bei SDS schützen.
Mit der Analyse einer einzelnen Festplatte ist es bei der Datenrettung in einem SDS-Umfeld nicht getan.
Bislang haben sich die IT-Abteilungen damit geholfen, immer neue Storage-Systeme anzuschaffen. Doch auf Dauer und infolge des immensen Anstiegs der Daten ist die bisherige Vorgehensweise, vorhandene RAID-Systeme durch den Kauf immer neuer Festplatten zu erweitern, zu kostspielig. Es kommt hinzu, dass die traditionelle Erweiterung meist mit einer ineffizienten Auslastung der Kapazitäten einhergeht. Gleichzeitig sind solche Systeme auch infolge der komplexen Struktur und Anbindung meist nicht besonders schnell, da eine Fülle von Flaschenhälsen im System lauern.

Das Konzept Software-defined Storage
Software-defined Storage verspricht eine Lösung für das Problem der steigenden Datenmenge. Wie der Name schon sagt, basiert hier die Verwaltung der gesamten Storage-Landschaft auf einer Software. Anders als beim Einsatz von SAN-, NAS- oder RAID-Systemen sind SDS-Systeme nicht Hardware-abhängig. So basieren die angebotenen SDS-Systeme nicht auf Controllern, die nur für Produkte eines bestimmten Herstellers konzipiert sind. Dadurch ist es theoretisch möglich, über die Software auch Hardware verschiedener Hersteller zu bündeln, gemeinsam zu betreiben und anzusteuern. Darüber hinaus lässt sich die Performance enorm verbessern – einige Hersteller werben mit bis zu fünffacher Geschwindigkeit gegenüber Hardware-basierten Systemen.

Grundsätzlich funktioniert ein modernes SDS-System so: Abhängig davon, wie das Gesamtsystem aufgebaut ist, wird auf die eingesetzten Server und/oder Client-Rechner die entsprechende SDS-Software installiert und eingerichtet. Diese stellt alle notwenigen Funktionen zur Verfügung, um sich über ein Netzwerk mit allen angeschlossenen reinen Speichermedien zu verbinden und diese anzusprechen. In einem SDS-System könnten beispielsweise drei Server mit der SDS-Software laufen und diese wiederum mit jeweils drei SAN-Storages verbunden werden. Letztlich kann in diesem Verbund jeder SDS-Server mit jedem Storage kommunizieren und das Datenmaterial verändern. Bei möglichen SDS-Konfigurationen sind der Phantasie also fast keine Grenzen gesetzt und Admins können freien Speicherplatz innerhalb von Minuten konfigurieren und die Speichernutzung über mehrere Festplatten und Storages hinweg verteilen.

Unabhängig davon, von welchem Anbieter das SDS-System kommt – da der Storage-Austausch jetzt durch die Software erfolgt und nicht mehr, wie bei Hardware-basierten Storages, über eingebaute Controller, – erhält jedes angebundene Speichermedium eine zusätzliche Softwareschicht. Denn die SDS-Software bringt, damit sie überhaupt in der Lage ist den gesamten Datenbestand im Storage zu verwalten, meist ein eigenes Dateisystem mit. Nur so lässt sich jede einzelne Datei in jedem angebundenen Medium im gesamten Storage-Verbund verwalten und direkt ansprechen. So hat IBM beispielsweise sein eigenes Filesystem GPFS erfunden, mit dem dann alle im System angebundenen Storages "überzogen" werden.
Datenstruktur bei Software-defined Storage
Die Antwort auf die Frage, wo Daten in einem SDS-System liegen, ist nicht ganz einfach, denn dies hängt stark vom verwendeten Produkt ab. Grundsätzlich bestehen SDS oder hyperkonvergente Lösungen aus mehreren unterschiedlichen Datenstrukturen. Um es einfach zu halten, lässt sich die Struktur mit einer russischen Matroschka-Puppe vergleichen: Die Benutzerdaten befinden sich in der tiefsten Ebene, während andere Technologien darauf ihre Datenschichten hinzufügen.

Bei einem SDS ist die höchste Datenschicht diejenige, die vom SDS-Controller erstellt wurde, einschließlich der Informationen über die virtuellen Speicher-Arrays. Die nächste Schicht ist die vom verwendeten Hypervisor erstellte Virtualisierungsschicht. Unter dieser Schicht befinden sich die Server-Layer, denen dann das Layer des physischen Mediums folgt. Insgesamt handelt es sich um vier Schichten, die die endgültige Datenstruktur bilden.

Ein weiteres Merkmal eines SDS oder einer hyperkonvergenten Lösung ist, dass einige ihre eigenen proprietären Dateisysteme verwenden. NetApp-Speicherlösungen nutzen beispielsweise ihr eigenes WAFL – Write Anywhere File Layout – System, das speziell für das ONTAP-Betriebssystem entwickelt und für den Einsatz in Netzwerkumgebungen optimiert wurde. Die Big-Data-Storage-Lösung von Dell EMC – Isilon – dagegen hat ein anderes Dateisystem mit dem Namen Isilon OneFS. Fast jede SDS-Lösung nutzt somit ihre eigenen Datei- und / oder Betriebssysteme, die dann erst einmal zu enträtseln sind, wenn Daten verloren gehen und wiederhergestellt werden sollen.

Seite 1: Wo sind die Daten bei SDS wirklich gespeichert?
Seite 2: Probleme und Risiken bei SDS-Datenverlusten


Seite 1 von 2 Nächste Seite >>
1.11.2017/ln/Michael Nuncic, Marketing Communications Manager bei Kroll Ontrack

Nachrichten

Wachsende Workloads, vereinfachte Verwaltung [19.02.2018]

Mit dem 'VxBlock 1000' baut Dell EMC sein Portfolio an konvergenten Infrastruktursystemen weiter aus. Die Neuvorstellung unterstützt Workloads aller Art und soll mir einer überarbeiteten Architektur den Platzbedarf im Rechenzentrum um bis zu 60 Prozent reduzieren. [mehr]

Schneller Restore aus der Cloud [8.02.2018]

Mit 'UDP Cloud Direct' bringt Arcserve eine neue Disaster-Recovery-as-a-Service- und Backup-as-a-Service-Lösung auf den Markt. Die Neuvorstellung vereint das Netzwerkmanagement und die Replikation des Herstellers mit einer neuen Cloud-Technologie. [mehr]

Tipps & Tools

Kontrolle über Speicherplatz behalten [23.02.2018]

Bei der Verwaltung der Festplattenressourcen auf dem PC kann das kostenfreie Tool 'MeinPlatz' weiter helfen. Die Software durchleuchtet sowohl die fest verbauten Datenträger als auch externe Speichermedien und listet Ihnen den belegten Speicherplatz von Ordnern und Dateien auf. Neben der Größe, Datei- und Ordneranzahl stellt das Werkzeug die prozentuelle Belastung der Festplatte relativ zur Gesamtgröße grafisch dar. [mehr]

AWS-Kosten treffsicher kalkulieren [16.01.2018]

Wenn es nach den entsprechenden Anbietern geht, löst die Cloud alle IT-Probleme, ist flexibler als On-Premises-Installationen und obendrein natürlich günstiger. Wenn aber jede Minute und jedes GByte einzeln berechnet und ein Dutzend verschiedener Dienstleistungen in Anspruch genommen wird, geraten die Ausgaben schnell außer Kontrolle. Zumindest für AWS gibt es mit dem 'Simple Monthly Calculator' einen Kostenrechner, der den individuellen Bedarf skizziert und für mehr Planungssicherheit sorgt. [mehr]

Buchbesprechung

Software Defined Networking

von Konstantin Agouros

Anzeigen