Fachartikel

Hochverfügbarkeit im Rechenzentrum

Moderne All-Flash-Arrays spielen in unternehmenskritischen Umgebungen nicht nur ihre Stärken in Sachen Performance aus. Sie leisten auf verschiedener Ebene einen entscheidenden Beitrag zur Hochverfügbarkeit. Dies beginnt auf unterster Speicherebene innerhalb jeder einzelnen Flash-Zelle. Hinzu kommen der objektbasierte RAID- und NVRAM-Schutz. Auf höchster Ebene trägt – je nach Entfernung – synchrone oder asynchrone Spiegelung an einen entfernten RZ-Standort zu einem maximalen Schutz der Daten bei. Dieser Beitrag erklärt die technischen Grundlagen.
Das Thema Hochverfügbarkeit beginnt bereits auf der Ebene des Storage-Arrays beziehungsweise Datenträgers.
Üblicherweise gibt es in Rechenzentren unterschiedliche redundante Aufbauten. So werden beispielsweise Dieselgeneratoren als unabhängige Stromversorgung eingesetzt, um einen Stromausfall zu überbrücken. Intelligente Kühlsysteme sollen einer kritischen Überhitzung entgegenwirken. Innerhalb des Systems kommen zudem redundante Komponenten mit zusätzlichen Mechanismen und Algorithmen zum Einsatz, damit der Verlust von Daten verhindert wird.

Flash: Hochverfügbarkeit ab Werk
Um Hochverfügbarkeit zu garantieren, müssen Unternehmen eine Vielzahl von Eventualitäten berücksichtigen. Dies kann auch im Kleinen für den verbauten Speicher gelten. Durch den Einsatz von All-Flash-Systemen können Administratoren eine extrem hohe Ausfallsicherheit sicherstellen.

Schutz innerhalb der Flash-Zelle
Innerhalb der All-Flash-Arrays gibt es verschiedene Ebenen, die letztlich zur Hochverfügbarkeit insgesamt beitragen. Bezogen auf ein All-Flash-Array beginnt der Schutz innerhalb der Flash-Zelle. Vereinfacht beschrieben werden die Daten oder Datensegmente durch eine Parity Page und eine zusätzliche Checksumme geschützt. Dadurch lassen sich einzelne Segmente schützen und im Fehlerfall, insbesondere beim Auftreten von Bitfehlern, beispielsweise durch Abnutzung der Zellen, wiederherstellen.
Objektbasierter RAID-Schutz
Eine weitere Ebene ist der objektbasierte RAID-Schutz. Einzelne Segmente werden zusammengefasst und durch mindestens zwei zusätzliche Paritäten geschützt. Anders als feste RAID-Geometrien, die sich in klassischen Festplattensystemen finden, arbeiten All-Flash-Arrays mit einer objektbasierten Geometrie. Diese schützt nicht nur im Falle des gleichzeitigen Ausfalls zweier Flash-Module, sondern stellt auch die Integrität der vergänglichen Flash-Zellen sicher.

Schreibsegmente werden dabei über möglichst viele Flash-Module verteilt, um auf der einen Seite einen größtmöglichen Schutz zu gewährleisten sowie auf der anderen Seite eine schnelle Wiederherstellung im Fehlerfall zu ermöglichen. Das Risiko von Datenverlust sinkt, da bei Ausfall eines Flash-Moduls die Wiederherstellung – der sogenannte RAID Reconstruct – nur wenige Minuten dauert. Im Vergleich dazu verliert man bei herkömmlichen Festplattensystemen viele Stunden. Als zusätzliche Maßnahme, um die Datenintegrität jederzeit sicherstellen zu können, werden diese Segmente kontinuierlich und ohne manuelles Zutun ständig geprüft.

NVRAM-Schutz
Hinzu kommt der Schutz der ankommenden Daten durch den NVRAM (Non-Volatile Random-Access Memory = nichtflüchtiger Datenspeicher). Daten, die einmal im System angekommen sind, werden in einem NVRAM zwischengepuffert. Dieser speichert auch im Falle eines Stromausfalls die Daten sicher und schreibt sie ansonsten auf die Flash-Module. Da bei einigen Systemen die NVRAM-Module ebenso redundant vorhanden sind wie die Controller-Einheiten, kann auf die Daten auch bei einem kompletten Verlust eines Controllers innerhalb des Hochverfügbarkeitssystems weiterhin zugegriffen werden – bei voller Performance.

Schutz durch Spiegelung
Allerdings sollten sich Unternehmen nicht ausschließlich auf die integrierten Sicherheitsmaßnahmen auf Speicher- und RAID-Ebene verlassen. Daten sind das zentrale Element jedes Rechenzentrums und sie sollten gegen den Ausfall des gesamten Systems, oder zum Schutz vor elementaren Schäden wie beispielsweise durch Wasser oder Feuer, in einem zweiten Brandabschnitt, Gebäude oder in einem weit entfernten Außenstandort gespiegelt werden.

Bei dieser höchsten Schutzebene unterscheidet man zwischen synchroner und asynchroner Spiegelung. Synchrone Spiegelung bedeutet: Jedes Mal, wenn Daten auf einen lokalen Speicher am Primärstandort geschrieben werden, werden die gleichen Daten auch auf einen Speicher an einem entfernten Standort geschrieben. Der Schreibvorgang gilt erst dann als abgeschlossen, wenn eine Bestätigung von der entfernten Site kommt. Dadurch wird sichergestellt, dass die beiden Datenstandorte jederzeit identisch – oder eben synchron – sind.

Sollte das primäre System nicht in der Lage sein, eine Anforderung zu bedienen, können Daten von der entfernten Stelle abgerufen werden. Synchrone Spiegelung bietet einen besseren Schutz, aber die Schreibvorgänge erfordern mehr Zeit. Je weiter der sekundäre Standort entfernt ist, desto länger dauert es, bis der Schreibvorgang abgeschlossen ist. Aus diesem Grund kommt bei weiter entfernten Standorten eher die asynchrone Spiegelung zum Einsatz. Dabei gelten die Schreibvorgänge als abgeschlossen, bevor das Schreiben am entfernten Standort bestätigt wird. Im Laufe der Zeit kann dies dazu führen, dass die Daten nicht mehr synchron sind, was das Potenzial für Datenverlust erhöht.

Bei der asynchronen Spiegelung gibt es aber noch einen anderen Weg: Die Daten werden auf die primäre Seite geschrieben und in festen Intervallen, beispielsweise im Fünf-Minuten-Abstand auf eine sekundäre Seite gespiegelt. Bevor die Daten übertragen werden, wird das Datenvolumen  reduziert durch Deduplizieren und Komprimieren. Das macht die Übertragung schnell, effizient und zuverlässig, ohne dabei besonders große Leitungskapazitäten zu beanspruchen.

Fazit
Hundertprozentiger Schutz vor Datenverlusten ist nahezu unmöglich. Mit den verfügbaren Maßnahmen und Technologien können Unternehmen und Rechenzentrumsbetreiber aber sicherstellen, dass die gespeicherten Daten auch im Falle eines Falles maximal geschützt sind. All-Flash-Arrays bieten vom technologischen Prinzip her und dank integrierter Sicherheitsmaßnahmen bereits ein hohes Schutzniveau für die Daten. Es gibt bereits All-Flash-Array mit einer Kapazität im PByte-Bereich und einer Verfügbarkeit von 99,9999 Prozent und einer konsistenten Servicequalität. Eingebunden in eine Hochverfügbarkeitsstrategie, inklusive Spiegelung an einen entfernten Standort, ist mit All-Flash eine für alle Eventualitäten und denkbaren Desaster-Szenarien gewappnete Speicherumgebung durchaus realisierbar.
8.02.2017/ln/Markus Wolf, Manager Systems Engineering DACH bei Pure Storage

Nachrichten

Neuer Storage-Switch von Brocade [28.03.2017]

Brocade stellt mit dem 'G610' einen neuen Storage-Switch vor, der die Konnektivität mit All-Flash-Rechenzentren sicherstellen soll. Der Neuzugang nutzt Brocades Gen-6-Fibre-Channel-Technologie und bietet bis zu 32 Gbps Leistung. [mehr]

Red Hat aktualisiert Gluster Storage [23.03.2017]

Mit 'Red Hat Gluster Storage 3.2' liefert der Open-Source-Anbieter die neue Version der Software-defined-Storage-Lösung aus. Zu den Erweiterungen und neue Features zählen laut Red Hat unter anderem eine höhere Performance kleiner Files, eine verbesserte Datenintegrität bei niedrigeren Kosten und eine vertiefte Integration in Red Hat OpenShift Container Platform. [mehr]

Tipps & Tools

Schneeball zur Datenübertragung [26.03.2017]

In der Regel sind nicht alle Standorte eines Unternehmens an ein Hochgeschwindigkeits-Internet angebunden. Eine Möglichkeit, um Archiv-Daten im zweistelligen TByte-Bereich in die Cloud zu übertragen, ist der AWS-Dienst 'Snowball'. Viele Organisationen stellen sich jedoch die Frage, ob dieser Datentransfer auch sicher ist und welche Vorbereitungen zu treffen sind. [mehr]

Download der Woche: MariaDB [28.02.2017]

Spätestens als Wikipedia vor rund vier Jahren auf die Datenbank 'MariaDB' migrierte, war das Nischendasein des seit 2009 bestehenden MySQL-Forks beendet. Eines der Versprechen der Abspaltung war, dass MariaDB stets unter einer freien Lizenz verfügbar sein sollte. Doch auch unter der Haube gibt es zahlreiche technische Unterschiede. So etwa unterstützt der Fork deutlich mehr Storage-Engines als MySQL. Ein weiterer Pluspunkt ist die große Nähe zur Community. [mehr]

Buchbesprechung

Datenschutz-Grundverordnung

von Niko Härting

Anzeigen