Fachartikel

Datenrettung bei Software-defined Storage

Die weltweiten Datenmengen sind enorm angewachsen. Immer mehr IoT-Geräte vernetzen sich und Firmen betreiben umfangreiches Data Mining, um noch mehr über die Kundenwünsche zu erfahren. Diese Informationsmasse auf physischem Speicher zu lagern, ist kaum noch kosteneffizient möglich. Abhilfe verspricht hier Software-defined Storage (SDS). Aber selbst dieser technologische Ansatz ist nicht vor Datenverlusten gefeilt. Der Artikel erklärt, Wie Sie sich vor einem Datenverlust bei SDS schützen.
Mit der Analyse einer einzelnen Festplatte ist es bei der Datenrettung in einem SDS-Umfeld nicht getan.
Bislang haben sich die IT-Abteilungen damit geholfen, immer neue Storage-Systeme anzuschaffen. Doch auf Dauer und infolge des immensen Anstiegs der Daten ist die bisherige Vorgehensweise, vorhandene RAID-Systeme durch den Kauf immer neuer Festplatten zu erweitern, zu kostspielig. Es kommt hinzu, dass die traditionelle Erweiterung meist mit einer ineffizienten Auslastung der Kapazitäten einhergeht. Gleichzeitig sind solche Systeme auch infolge der komplexen Struktur und Anbindung meist nicht besonders schnell, da eine Fülle von Flaschenhälsen im System lauern.

Das Konzept Software-defined Storage
Software-defined Storage verspricht eine Lösung für das Problem der steigenden Datenmenge. Wie der Name schon sagt, basiert hier die Verwaltung der gesamten Storage-Landschaft auf einer Software. Anders als beim Einsatz von SAN-, NAS- oder RAID-Systemen sind SDS-Systeme nicht Hardware-abhängig. So basieren die angebotenen SDS-Systeme nicht auf Controllern, die nur für Produkte eines bestimmten Herstellers konzipiert sind. Dadurch ist es theoretisch möglich, über die Software auch Hardware verschiedener Hersteller zu bündeln, gemeinsam zu betreiben und anzusteuern. Darüber hinaus lässt sich die Performance enorm verbessern – einige Hersteller werben mit bis zu fünffacher Geschwindigkeit gegenüber Hardware-basierten Systemen.

Grundsätzlich funktioniert ein modernes SDS-System so: Abhängig davon, wie das Gesamtsystem aufgebaut ist, wird auf die eingesetzten Server und/oder Client-Rechner die entsprechende SDS-Software installiert und eingerichtet. Diese stellt alle notwenigen Funktionen zur Verfügung, um sich über ein Netzwerk mit allen angeschlossenen reinen Speichermedien zu verbinden und diese anzusprechen. In einem SDS-System könnten beispielsweise drei Server mit der SDS-Software laufen und diese wiederum mit jeweils drei SAN-Storages verbunden werden. Letztlich kann in diesem Verbund jeder SDS-Server mit jedem Storage kommunizieren und das Datenmaterial verändern. Bei möglichen SDS-Konfigurationen sind der Phantasie also fast keine Grenzen gesetzt und Admins können freien Speicherplatz innerhalb von Minuten konfigurieren und die Speichernutzung über mehrere Festplatten und Storages hinweg verteilen.

Unabhängig davon, von welchem Anbieter das SDS-System kommt – da der Storage-Austausch jetzt durch die Software erfolgt und nicht mehr, wie bei Hardware-basierten Storages, über eingebaute Controller, – erhält jedes angebundene Speichermedium eine zusätzliche Softwareschicht. Denn die SDS-Software bringt, damit sie überhaupt in der Lage ist den gesamten Datenbestand im Storage zu verwalten, meist ein eigenes Dateisystem mit. Nur so lässt sich jede einzelne Datei in jedem angebundenen Medium im gesamten Storage-Verbund verwalten und direkt ansprechen. So hat IBM beispielsweise sein eigenes Filesystem GPFS erfunden, mit dem dann alle im System angebundenen Storages "überzogen" werden.
Datenstruktur bei Software-defined Storage
Die Antwort auf die Frage, wo Daten in einem SDS-System liegen, ist nicht ganz einfach, denn dies hängt stark vom verwendeten Produkt ab. Grundsätzlich bestehen SDS oder hyperkonvergente Lösungen aus mehreren unterschiedlichen Datenstrukturen. Um es einfach zu halten, lässt sich die Struktur mit einer russischen Matroschka-Puppe vergleichen: Die Benutzerdaten befinden sich in der tiefsten Ebene, während andere Technologien darauf ihre Datenschichten hinzufügen.

Bei einem SDS ist die höchste Datenschicht diejenige, die vom SDS-Controller erstellt wurde, einschließlich der Informationen über die virtuellen Speicher-Arrays. Die nächste Schicht ist die vom verwendeten Hypervisor erstellte Virtualisierungsschicht. Unter dieser Schicht befinden sich die Server-Layer, denen dann das Layer des physischen Mediums folgt. Insgesamt handelt es sich um vier Schichten, die die endgültige Datenstruktur bilden.

Ein weiteres Merkmal eines SDS oder einer hyperkonvergenten Lösung ist, dass einige ihre eigenen proprietären Dateisysteme verwenden. NetApp-Speicherlösungen nutzen beispielsweise ihr eigenes WAFL – Write Anywhere File Layout – System, das speziell für das ONTAP-Betriebssystem entwickelt und für den Einsatz in Netzwerkumgebungen optimiert wurde. Die Big-Data-Storage-Lösung von Dell EMC – Isilon – dagegen hat ein anderes Dateisystem mit dem Namen Isilon OneFS. Fast jede SDS-Lösung nutzt somit ihre eigenen Datei- und / oder Betriebssysteme, die dann erst einmal zu enträtseln sind, wenn Daten verloren gehen und wiederhergestellt werden sollen.

Seite 1: Wo sind die Daten bei SDS wirklich gespeichert?
Seite 2: Probleme und Risiken bei SDS-Datenverlusten


Seite 1 von 2 Nächste Seite >>
1.11.2017/ln/Michael Nuncic, Marketing Communications Manager bei Kroll Ontrack

Nachrichten

Plattformübergreifendes ReFS [29.08.2018]

Paragon Software veröffentlicht mit "ReFS for Windows" ein Werkzeug für den einheitlichen Zugriff auf ReFS-formatierte Datenträger über alle Windows-Varianten hinweg. Die Software, die sich stand-alone als auch integriert in die Infrastruktur betreiben lässt, adressiert Inkompatibiltäten, die bei der ReFS-Verwaltung auftreten, wenn unterschiedliche Releases von Windows darauf zugreifen. [mehr]

14 TByte auf neun Plattern [28.08.2018]

Toshiba bringt mit der 'MG07SCA'-Serie neue 14 und 12 TByte große, Helium-versiegelte HDDs der Enterprise-Klasse mit 12-GBit/s-SAS-Interface auf den Markt. Die Festplatten drehen mit 7.200rpm und basieren auf der Advanced-Format-Sector-Technologie. [mehr]

Tipps & Tools

Praktische Ablage für Webseiten [21.08.2018]

Oft stoßen Webnutzer auf interessante Seiten, die sie gerne später in Ruhe lesen möchten. Ein Weg sind Lesezeichen im Browser. Deutlich flexibler zeigt sich jedoch der Dienst 'Getpocket'. Dieser legt die zu merkenden URLs für eine spätere Verwendung einfach online ab, wobei auch Videos oder Bilder speicherbar sind. [mehr]

Standalone-Agent zur Datensicherung [10.08.2018]

Mit dem neuen 'Veeam Agent for Microsoft Windows' steht ab sofort ein neues Tool bereit, das auf Windows-Funktionalitäten aufsetzt und sichere Backup- und Wiederherstellungsroutinen ermöglicht. Im das Risiko von Datenverlust zu minimieren, lässt sich mit dem Werkzeug auch die Public Cloud als Zielort der Sicherung auswählen. Die Neuvorstellung ist für eine beliebige Anzahl von Endpunkten kostenlos. [mehr]

Buchbesprechung

VoIP Praxisleitfaden

von Jörg Fischer und Christian Sailer

Anzeigen