Fachartikel

Infrastrukturdesign für Big Data und Echtzeitanalysen (1)

Big Data und das Internet der Dinge sind mehr als nur Modeworte. Sie beschreiben komplexe Computertrends, die klassische Analyseplattformen wie Datenlager sowohl verdrängen als auch erweitern. Die damit verbundenen Ansprüche hinsichtlich Performance und Verfügbarkeit erhöhen den Druck auf die Storage-Systeme. Wie unser Beitrag zeigt, ist es selbst mit All-Flash-Arrays nicht immer einfach, die Anforderungen an Dichte und Kosten zu erfüllen. Im ersten Teil gehen wir auf die Faktoren ein, die zum Entstehen großer Datenmengen führen und streifen die zugrundeliegenden Technologien.
Immer mehr maschinengenerierte Daten und mehr Verkehr im Internet sorgen für ein gewaltiges Datenwachstum.
Gut vergleichbar mit dem Mooreschen Gesetz über die Verdopplung der Rechenleistung alle zwei Jahre hat sich der Umfang der auf Speicherarrays gespeicherten Daten exponentiell entwickelt. Eine IDC-Studie etwa geht davon aus, dass sich das "Datenuniversum" – also alle bekannten Daten der Welt – von 2010 bis 2020 von 300 auf 40.000 Exabyte (40 Milliarden TByte) erweitern wird. Dieses Wachstum ist auf unterschiedliche Quellen zurückzuführen:


  • Maschinengenerierte Daten (MGD) von intelligenten Geräten, Messgeräten und Computern.
  • Internetdatenverkehr von Anwendern, die das Internet mit verschiedensten Geräten nutzen.
  • Streaming von Logdaten für Analyse- und Sicherheitszwecke.
Keine dieser Daten werden dabei direkt von Menschen erzeugt. Da wir acht Stunden am Tag schlafen und eine begrenzte Schreibgeschwindigkeit haben, sind die von uns generierten Daten von Natur aus beschränkt. Für von Maschinen generierte Daten wiederum gibt es praktisch keine Grenzen. Daher ist Big Data zu einer Realität geworden, die auch in Zukunft noch an Bedeutung zunehmen wird.
Technologien im Wechselspiel
Mit dem wachsenden Datenvolumen und der zunehmenden Rechenleistung gibt es weitere grundlegende Entwicklungen bei den IT-Infrastrukturen, die das Wachstum weiter befeuern: Virtualisierung, Cloud Computing und Solid-State-Speicher.

Dabei ist wichtig zu wissen, dass diese Trends erst durch die Zunahme der Rechenleistung und Speicherdichte möglich geworden sind. Die Speicher erlauben heute eine dichtere Virtualisierung, Caching im Speicher und ganz allgemein eine bessere Systemleistung. Durch die wachsende CPU-Leistung können Solid-State-Geräte Technologien wie Komprimierung nutzen, um die Leistung und Speicherdichte weiter zu verbessern. Es ist also nicht überraschend, dass diese Trends sich über die Rechenleistung gegenseitig vorantreiben.

  • Virtualisierung: Die Virtualisierung hat eine lange Tradition in der Informatik, aber die x86-Virtualisierung ist es, die das 21. Jahrhundert definiert. Die Virtualisierung bietet hohe Flexibilität und ermöglicht die Software-basierte Definition von so gut wie allen Vorgängen. Dadurch hat sie die Entstehung der Cloud – sowohl privat als auch öffentlich – erst möglich gemacht. Die Virtualisierung hat durch die Konsolidierung von Workloads aber auch den Druck auf die Untersysteme von Speichern erhöht.

  • Cloud Computing: Cloud Computing ist mehr als nur Virtualisierung. Es bedarf zusätzlich einer guten Dosis Automatisierung und Deployment-Technologie. Dennoch läuft es am Ende sowohl bei der öffentlichen als auch der privaten Cloud darauf hinaus, dass die Workloads auf einer virtuellen Maschine in einem Rechenzentrum laufen.

  • Solid-State-Speicher: Trotz moderner CPUs und hoher Speicherdichte entstehen bei vielen Computersystemen auf der Speicherebene nach wie vor Flaschenhälse, da dort veraltete Festplatten mit rotierenden Scheiben zum Einsatz kommen. Diese können in Sachen I/O-Operationen pro Sekunde (IOPs), Durchsatz und Latenz nicht mit der Leistung einer CPU mithalten. Auch immer mehr konsolidierte Workloads und die Nachfrage nach Echtzeitanalysen haben zu mehr Bedarf an besserer Speicherleistung geführt. In der Vergangenheit ließ sich die Speicherleistung dann nur durch das Hinzufügen weiterer Festplatten steigern, was hinsichtlich des Stromverbrauchs, des Verwaltungsaufwands und des Hardware-Bedarfs aber sehr kostenintensiv war. Solid-State-Speicher lösen viele dieser Probleme.
Glücklicherweise gibt es einige Faktoren, die Solid State mittlerweile fast zum Mainstream gemacht haben. Der erste Faktor ist die allgemeine deutliche Verbilligung von NAND-Flash in den letzten Jahren. Zudem hat die zunehmende CPU-Leistung es Anbietern ermöglicht, Technologien wie Deduplizierung und Komprimierung einzusetzen, mit denen die Speicherdichte von SSDs beinahe der von Festplatten entspricht. Die höhere Dichte und niedrigeren Kosten haben SSDs zu einer ernstzunehmenden Option für beinahe alle Enterprise-Workloads und eine Voraussetzung für kritische Datensysteme gemacht.

Seite 1: Technologien im Wechselspiel
Seite 2: Datenstreaming für operativen Analysen


Seite 1 von 2 Nächste Seite >>
15.03.2017/ln/Tobias Engmann, SE Manager DACH bei Tegile Systems

Nachrichten

Update für DataCores SDS-Familie [19.10.2017]

DataCore veröffentlicht mit dem Product Service Pack 7 Weiterentwicklungen seiner für seine Software-defined-Storage-Produkte 'SANsymphony' und 'DataCore Hyperconverged Virtual SAN'. Die PSP7-Version bietet unter anderem neue Funktionen für die Mehrfach-Spiegelung zwischen Standorten in Metro-Distanz. [mehr]

Datenretter in neuem Gewand [17.10.2017]

Kroll Ontrack bringt eine neue Version von 'Ontrack EasyRecovery' zur Datenrettung für Windows und MacOS heraus. Mit dem Do-it-yourself-Ansatz sollen sowohl private Nutzer als auch Unternehmen sämtliche Daten von internen Festplatten und SSDs sowie von externen Medien wie USB-Drives und SD-Karten abrufen können. Beschädigte oder gelöschte Dateien sowie Daten von formatierten, korrumpierten oder initialisierten Datenträgern lassen sich wiederherstellen. [mehr]

Tipps & Tools

Vorschau November 2017: Software-defined Storage [18.10.2017]

Die Datenmengen in Unternehmen wachsen täglich. Für Administratoren bedeutet dies, den zur Verfügung stehenden Speicherplatz permanent anzupassen und flexibel auf kurzfristige Anforderungen reagieren zu können. Im November befasst sich IT-Administrator mit dem Schwerpunkt 'Software-defined Storage'. Darin erläutern wir unter anderem die Einsatzszenarien für Speichervirtualisierung sowie aktuelle Trends in dem Bereich. Auch lesen Sie, welche Vorteile das Dateisystem LizardFS zu bieten hat und wie Sie Storage Spaces Direct unter Windows Server 2016 einrichten. In den Produkttests zeigt unter anderem NetApp ONTAP Select, was es in Sachen Storage-Management zu bieten hat. [mehr]

Rettung für Word-Dateien [16.08.2017]

Auch wenn IT-Profis quasi von Geburt an mit 'Strg + S' alle paar Minuten ihre bearbeiteten Dateien sichern, können dennoch unvorhergesehene Schäden an wichtigen Dokumenten auftreten. Sei es durch Stromausfall oder Mitarbeiter, die eine frei gegebene gemeinsame Datei zerschießen. In solchen Fällen können Sie das Tool 'Word Recovery' ausprobieren. [mehr]

Buchbesprechung

Citrix XenMobile 10

von Thomas Krampe

Anzeigen