Grundlagen

Backup und Recovery

In unserer Grundlagen-Rubrik erklären wir wichtige Aufgaben und Technologien aus dem Arbeitsalltag eines Netzwerk- und Systemadministrators. Hier erfahren Sie anhand prägnanter Erklärungen zu den wichtigsten Begriffen des jeweiligen Themenfeldes Hintergründe und Zusammenhänge in kompakter, praxisnaher Form.

Backups spielen eine zentrale Rolle in der Datensicherheit. Nur mit ihrer Hilfe lassen sich Datenverluste zuverlässig vermeiden, die etwa durch technische Defekte oder Bedienfehler entstehen. Je nach Art der Daten, den laufenden Änderungen an ihnen und der benötigten Wiederherstellzeit im Fall eines Recovery bieten sich unterschiedliche Backup-Methoden an. Nicht zuletzt spielt die Kostenfrage eine Rolle, wenn es um die Wahl von Backup-Medien und -Methoden geht.
Vollbackups vs. inkrementelle Sicherungen
Beim aktuellen Datenwachstum ist es wichtig, den bestehenden Speicherplatz sinnvoll zu nutzen und nicht einfach täglich eine Volldatensicherung von allen Daten zu erstellen. Gangbar sind hier derzeit zwei weitere Arten des Backups: Für das tägliche Backup der Daten ist eine inkrementelle Datensicherung das Mittel der Wahl. Dabei werden lediglich alle geänderten Daten seit der letzten inkrementellen oder Volldatensicherung kopiert. Diese Methode kann je nach Infrastruktur sehr viel Zeit, Bandbreite im Netzwerk und Speicherplatz sparen. Es gibt jedoch auch Nachteile, denn durch eine inkrementelle Datensicherung erhöhen sich bei einer Rücksicherung Zeit und Aufwand. Dies liegt daran, dass erst die letzte Vollsicherung und danach alle inkrementellen Datensicherungen Schritt für Schritt wiederhergestellt werden müssen.

Sollte es seit der letzten Vollsicherung nur wenige Änderungen gegeben haben oder eine hohe Verfügbarkeitsanforderung an die betroffenen Daten bestehen, ist eine differenzielle Datensicherung empfehlenswert. Dabei kommt es lediglich zu einem Speichern aller seit der letzten Vollsicherung geänderten Daten. Damit lässt sich bei der Rücksicherung viel Zeit sparen. Noch recht neu auf dem Markt sind Datensicherungslösungen, die eine Datei unmittelbar nach einer Änderung sichern. Diese Lösungen dienen einem kontinuierlichen Schutz von Daten und werden häufig für die Absicherung unternehmenskritischer Daten wie E-Mails, Freigaben oder Datenbanken genutzt.

Datenspezifikation bedingt Backup-Art
Über ein Backup lassen sich verschiedene Typen von Daten sichern. Die Spezifikation der zu sichernden Daten spielt eine große Rolle, da zwischen Anwendungs- und Betriebssoftware, System-, Anwendungs- und Protokolldaten unterschieden wird. So finden sich in einer Sicherung einzelne Dateien und Ordner, Datenbanken oder virtuelle Infrastrukturen wie XEN, VMware oder Microsoft Hyper-V. Ein Backup kann jedoch nicht alles abdecken – beispielsweise lässt sich mit einer reinen Datensicherung kein Betriebssystem speichern. Dies ist lediglich mit einem sogenannten Abbild (Image) möglich. Mit dem Speicherabbild lassen sich ganze Partitionen sichern und wiederherstellen, es werden alle Daten auf der Partition inklusive Speicherort gesichert. Dies ist notwendig, da für das Starten des Betriebssystems einige Dateien (wie etwa die Auslagerungsdatei) an einer vordefinierten Stelle auf der Festplatte abgelegt sein müssen.

Wahl des passenden Speichermediums
Grundsätzlich gibt es drei Arten von Speichermedien: optische Datenträger, Magnetbänder und Festplatten. Tape-Laufwerke genießen eine lange Tradition bei der Datensicherung, haben allerdings auch ihre Nachteile. So ist es schwierig, sie dauerhaft am Streamen zu halten. Staubpartikel gefährden Bandmedien ebenso wie die Schreib-Leseköpfe. Ein RAID-Verbund für Tape ist nicht sinnvoll umsetzbar, so dass Störungen drohen. Der hohe Preis der Tape-Laufwerke limitiert die Anzahl paralleler Sicherungsprozesse stark. Insgesamt gesehen ist Tape als primäres Sicherungsmedium nur noch selten empfehlenswert. Für Backup-Kopien als Ergänzung zu B2D (auch über NDMP für Snapshot-basiertes Backup) und vor allem für die langfristige Haltung von Backups ist Tape dagegen oft weiterhin sinnvoll.

Die Datensicherung auf Festplatten ermöglicht gegenüber Backup to Tape eine deutliche Verringerung der Vollbackups durch häufigere inkrementelle Backups. Dies kann zwar zu moderat längeren Restore-Zeiten führen, aber die Vorteile beim Backup überwiegen, denn es wird deutlich weniger Speicherkapazität verbraucht und die I/O-Last für die Backups nimmt signifikant ab. Auch für die meisten Datenbanken ist dies anwendbar (Oracle, MaxDB und IBM DB2 unterstützen Blocklevel Incremental. Microsoft SQL Server unterstützt seit Windows Server 2008 differenzielle Sicherungen). Die Reduzierung der Vollbackups macht auch Sinn, wenn Kompression oder Deduplizierung folgen.

Bleiben die Backup-Daten unkomprimiert, wird es aufgrund des hohen Plattenspeicherbedarfs bereits nach wenigen Tagen unwirtschaftlich, die Backups auf Disk vorzuhalten, was die Reduzierung der Vollbackups stark einschränkt. Daher ist B2D auf komprimierbaren Disk-Medien meist sinnvoller. Dies ist gegenüber der Deduplizierung risikoarm und bietet eine hohe Lesegeschwindigkeit für Restores und Bandkopien. Eine Reduzierung auf zwei- bis vierwöchige Vollbackups ist hiermit oft möglich.

Deduplizierung gegen doppelte Datenhaltung
Deduplizierung bietet sich an, falls beim Backup zahlreiche Dubletten gesichert werden, etwa aufgrund mehrerer Vollbackups oder mehrfach vorhandener Dateninhalte. In diesem Falle lassen sich mit Deduplizierung deutlich größere Verdichtungsraten erreichen. Wird "inline", also während statt nach dem Sicherungsprozess dedupliziert, entfallen Plattenkapazitäten als Zwischenspeicher ebenso wie Nachverdichtungsprozesse. Der reduzierte Plattenbedarf erlaubt oft eine Backup-Vorhaltezeit von bis zu etwa drei Monaten. Außerdem können mit Hilfe einer deduplizierten Replizierung Desaster-Kopien der Backups über WAN in ein entferntes Rechenzentrum transferiert werden.

Nach einer Deduplizierung erfordert das sequenzielle Lesen deduplizierter Daten jedoch zahlreiche gestreute Disk-I/Os. Dies bremst parallel angeforderte Rücksicherungen und Bandkopien stark. Obwohl mehrere am Markt befindliche Lösungen relativ ausgereift sind, sind gewisse Risiken der Deduplizierungstechnik abzuwägen, wie etwa die intern komplexe Verpointerung für Datensicherungsstrom-Deduplizierung, meist noch ergänzt um das so genannte Hash Key Collision -Risiko: Erfolgt bei gleichen Hash Keys aus Performancegründen keine Verifikation auf Datengleichheit, können Datenverluste bei späteren Restores eintreten – über alle vorgehaltenen Sicherungsgenerationen hinweg.

Backups in virtuellen Umgebungen
Die zunehmende Beliebtheit der Virtualisierungstechnologie erfordert von Administratoren gleichzeitig Kenntnisse der grundlegenden Sicherungsplanung sowie Möglichkeiten für ein professionelles und effizientes Daten-Management in virtuellen Umgebungen. Zu groß ist sonst die Gefahr eines Datenverlusts für das Unternehmen. Um virtuelle Umgebungen zu sichern, gibt es verschiedene Herangehensweisen.

Das Backup kann von außen am Host-System selbst erstellt werden. Dabei erfolgt die Sicherung der virtuellen Maschinen zunächst durch ein einfaches File-Backup der Gesamtdatei, die die Informationen der virtuellen Maschinen beinhaltet. In der Praxis hat diese Methode jedoch den Nachteil, dass virtuelle Maschinen im produktiven Einsatz einen sich ständig ändernden Satz an Benutzerdaten, Einstellungen und Anwendungen mitbringen. Es besteht also die Gefahr, dass durch ein einfaches Datei-Backup über den Host diese Zustandsinformationen und damit der vollständige Status einer laufenden virtuellen Maschine nicht gesichert werden. Um ein konsistentes Backup zu erstellen, muss die virtuelle Maschine für den Datensicherungsprozess in den Suspend-Modus gesetzt oder besser noch heruntergefahren werden – was für einen Server in einer produktiven Umgebung jedoch keine wirklich realistische Option darstellt.

Eine weitere Möglichkeit neben der Sicherung über das Wirtssystem besteht in der Datensicherung und Wiederherstellung durch einen Agenten innerhalb virtueller Maschinen. Aktuelle Disaster-Recovery-Lösungen bieten so alle Möglichkeiten, die sie auch aus der physikalischen Backup-Welt bekannt sind. Die Agenten behandeln die virtuellen Maschinen wie jeden anderen Server im Netzwerk und ermöglichen das Erstellen von Images sowie von inkrementellen und differenziellen Backups im laufenden Betrieb.

Im Desaster-Fall können Administratoren einzelne Dateien, Ordner oder komplette Daten-Partitionen innerhalb weniger Minuten wiederherstellen. Sobald die Zahl der virtuellen Server aber wächst, entstehen die ersten Probleme. Einerseits steigt der Verwaltungsaufwand für Administratoren, die einen Backup-Agenten für jede virtuelle Maschine managen müssen, andererseits werden die durch die Virtualisierung erwarteten Kosteneinsparungen stark strapaziert, wenn Lizenzkosten für jeden Agenten fällig werden.
19.04.2011/dr

Nachrichten

Intelligente Transaktionen [14.01.2020]

Mit "MariaDB Platform X4" erscheint die neue Version der Open-Source-Datenbank und folgt einem umfassenden Cloud-Native-Ansatz. Das jüngste Release arbeitet mit einem neuen Typ intelligenter Engines und deutlich vereinfachtem Design. Punkten soll die Datenbank nicht zuletzt dadurch, dass sie sowohl transaktionale, analytische als auch hybride Workloads verarbeiten kann. [mehr]

Objekt-Storage für Tape [10.12.2019]

PoINT hat sein "PoINT Archival Gateway" um diverse Funktionen erweitert und stellt für kleine bis mittlere Installationen jetzt auch eine Compact Edition seines S3-Objekt-Storage für Tape bereit. Mit dieser Variante adressiert der Hersteller insbesondere Unternehmen, die ein Datenvolumen im einstelligen PByte-Bereich auf Tape-Medien speichern und verwalten wollen. [mehr]

Tipps & Tools

Download der Woche: Meld [15.10.2019]

Bei der Systemwartung finden sich immer wieder doppelt vorhandene Dateien und Ordner unter Windows. Diese sorgen nicht nur für Verwirrung, sondern rauben auch Zeit beim Säubern der Struktur auf dem Rechner. Mit dem kostenfreien Tool "Meld" lassen sich durch einen sogenannten "Zwei- und Drei-Wege-Vergleich" sowohl von Files als auch Verzeichnissen die nicht mehr benötigten Daten ermitteln. [mehr]

Backupserver absichern [6.10.2019]

Backupserver spielen in vielen Unternehmen eine wichtige Rolle, wenn es darum geht, geschäftskritische Informationen mit einer Backup-Software vor dem Verlust zu schützen. Dieser Tipp verrät, wie sich der Backupserver mithilfe von Veritas Backup Exec am besten sichern und wiederherstellen lässt. [mehr]

Buchbesprechung

Handbuch Online-Shop

von Alexander Steireif, Rouven Rieker, Markus Bückle

Anzeigen