Fachartikel

Datenrettung bei Software-defined Storage

Die weltweiten Datenmengen sind enorm angewachsen. Immer mehr IoT-Geräte vernetzen sich und Firmen betreiben umfangreiches Data Mining, um noch mehr über die Kundenwünsche zu erfahren. Diese Informationsmasse auf physischem Speicher zu lagern, ist kaum noch kosteneffizient möglich. Abhilfe verspricht hier Software-defined Storage (SDS). Aber selbst dieser technologische Ansatz ist nicht vor Datenverlusten gefeilt. Der Artikel erklärt, Wie Sie sich vor einem Datenverlust bei SDS schützen.
Mit der Analyse einer einzelnen Festplatte ist es bei der Datenrettung in einem SDS-Umfeld nicht getan.
Bislang haben sich die IT-Abteilungen damit geholfen, immer neue Storage-Systeme anzuschaffen. Doch auf Dauer und infolge des immensen Anstiegs der Daten ist die bisherige Vorgehensweise, vorhandene RAID-Systeme durch den Kauf immer neuer Festplatten zu erweitern, zu kostspielig. Es kommt hinzu, dass die traditionelle Erweiterung meist mit einer ineffizienten Auslastung der Kapazitäten einhergeht. Gleichzeitig sind solche Systeme auch infolge der komplexen Struktur und Anbindung meist nicht besonders schnell, da eine Fülle von Flaschenhälsen im System lauern.

Das Konzept Software-defined Storage
Software-defined Storage verspricht eine Lösung für das Problem der steigenden Datenmenge. Wie der Name schon sagt, basiert hier die Verwaltung der gesamten Storage-Landschaft auf einer Software. Anders als beim Einsatz von SAN-, NAS- oder RAID-Systemen sind SDS-Systeme nicht Hardware-abhängig. So basieren die angebotenen SDS-Systeme nicht auf Controllern, die nur für Produkte eines bestimmten Herstellers konzipiert sind. Dadurch ist es theoretisch möglich, über die Software auch Hardware verschiedener Hersteller zu bündeln, gemeinsam zu betreiben und anzusteuern. Darüber hinaus lässt sich die Performance enorm verbessern – einige Hersteller werben mit bis zu fünffacher Geschwindigkeit gegenüber Hardware-basierten Systemen.

Grundsätzlich funktioniert ein modernes SDS-System so: Abhängig davon, wie das Gesamtsystem aufgebaut ist, wird auf die eingesetzten Server und/oder Client-Rechner die entsprechende SDS-Software installiert und eingerichtet. Diese stellt alle notwenigen Funktionen zur Verfügung, um sich über ein Netzwerk mit allen angeschlossenen reinen Speichermedien zu verbinden und diese anzusprechen. In einem SDS-System könnten beispielsweise drei Server mit der SDS-Software laufen und diese wiederum mit jeweils drei SAN-Storages verbunden werden. Letztlich kann in diesem Verbund jeder SDS-Server mit jedem Storage kommunizieren und das Datenmaterial verändern. Bei möglichen SDS-Konfigurationen sind der Phantasie also fast keine Grenzen gesetzt und Admins können freien Speicherplatz innerhalb von Minuten konfigurieren und die Speichernutzung über mehrere Festplatten und Storages hinweg verteilen.

Unabhängig davon, von welchem Anbieter das SDS-System kommt – da der Storage-Austausch jetzt durch die Software erfolgt und nicht mehr, wie bei Hardware-basierten Storages, über eingebaute Controller, – erhält jedes angebundene Speichermedium eine zusätzliche Softwareschicht. Denn die SDS-Software bringt, damit sie überhaupt in der Lage ist den gesamten Datenbestand im Storage zu verwalten, meist ein eigenes Dateisystem mit. Nur so lässt sich jede einzelne Datei in jedem angebundenen Medium im gesamten Storage-Verbund verwalten und direkt ansprechen. So hat IBM beispielsweise sein eigenes Filesystem GPFS erfunden, mit dem dann alle im System angebundenen Storages "überzogen" werden.
Datenstruktur bei Software-defined Storage
Die Antwort auf die Frage, wo Daten in einem SDS-System liegen, ist nicht ganz einfach, denn dies hängt stark vom verwendeten Produkt ab. Grundsätzlich bestehen SDS oder hyperkonvergente Lösungen aus mehreren unterschiedlichen Datenstrukturen. Um es einfach zu halten, lässt sich die Struktur mit einer russischen Matroschka-Puppe vergleichen: Die Benutzerdaten befinden sich in der tiefsten Ebene, während andere Technologien darauf ihre Datenschichten hinzufügen.

Bei einem SDS ist die höchste Datenschicht diejenige, die vom SDS-Controller erstellt wurde, einschließlich der Informationen über die virtuellen Speicher-Arrays. Die nächste Schicht ist die vom verwendeten Hypervisor erstellte Virtualisierungsschicht. Unter dieser Schicht befinden sich die Server-Layer, denen dann das Layer des physischen Mediums folgt. Insgesamt handelt es sich um vier Schichten, die die endgültige Datenstruktur bilden.

Ein weiteres Merkmal eines SDS oder einer hyperkonvergenten Lösung ist, dass einige ihre eigenen proprietären Dateisysteme verwenden. NetApp-Speicherlösungen nutzen beispielsweise ihr eigenes WAFL – Write Anywhere File Layout – System, das speziell für das ONTAP-Betriebssystem entwickelt und für den Einsatz in Netzwerkumgebungen optimiert wurde. Die Big-Data-Storage-Lösung von Dell EMC – Isilon – dagegen hat ein anderes Dateisystem mit dem Namen Isilon OneFS. Fast jede SDS-Lösung nutzt somit ihre eigenen Datei- und / oder Betriebssysteme, die dann erst einmal zu enträtseln sind, wenn Daten verloren gehen und wiederhergestellt werden sollen.

Seite 1: Wo sind die Daten bei SDS wirklich gespeichert?
Seite 2: Probleme und Risiken bei SDS-Datenverlusten


Seite 1 von 2 Nächste Seite >>
1.11.2017/ln/Michael Nuncic, Marketing Communications Manager bei Kroll Ontrack

Nachrichten

Hochverfügbares All-Flash-NAS [17.02.2020]

QNAP erweitert sein NAS-Portfolio für den Enterprise-Bereich um das All-Flash-Array "ES2486dc" mit 24 Festplatteneinschüben. Mit seiner dualen ActiveActive-Architektur soll das Gerät für nahezu störungsfreie Hochverfügbarkeit sorgen. [mehr]

Hochverfügbares NAS mit Dual-Controller [31.01.2020]

Synology hat mit dem "SA3200D" ein neues NAS auf den Markt gebracht. Hierbei handelt es sich um ein Speichersystem mit einem aktiven und einem passiven Controller für maximale Systemverfügbarkeit. Die Neuvorstellung soll Unternehmen helfen, ihr Datenmanagement zu vereinfachen und zu zentralisieren. [mehr]

Tipps & Tools

Download der Woche: Meld [15.10.2019]

Bei der Systemwartung finden sich immer wieder doppelt vorhandene Dateien und Ordner unter Windows. Diese sorgen nicht nur für Verwirrung, sondern rauben auch Zeit beim Säubern der Struktur auf dem Rechner. Mit dem kostenfreien Tool "Meld" lassen sich durch einen sogenannten "Zwei- und Drei-Wege-Vergleich" sowohl von Files als auch Verzeichnissen die nicht mehr benötigten Daten ermitteln. [mehr]

Backupserver absichern [6.10.2019]

Backupserver spielen in vielen Unternehmen eine wichtige Rolle, wenn es darum geht, geschäftskritische Informationen mit einer Backup-Software vor dem Verlust zu schützen. Dieser Tipp verrät, wie sich der Backupserver mithilfe von Veritas Backup Exec am besten sichern und wiederherstellen lässt. [mehr]

Buchbesprechung

Handbuch Online-Shop

von Alexander Steireif, Rouven Rieker, Markus Bückle

Anzeigen