Meldung

Data Warehousing leicht gemacht

Wer als Unternehmen Berichte und Analysen von großen, strukturierten Datenmengen vornehmen möchte, die langfristig gespeichert und mit BI-Tools abgefragt werden, kann dies auch in der Cloud tun. AWS etwa hat mit Amazon Redshift und Amazon RDS gleich zwei Online-Dienste im Angebot. Was sie unterscheidet und wie Sie Ihre Daten in den Service laden, erklären wir in diesem Tipp.
Amazon Redshift oder RDS? Wie immer kommt es auf den Anwendungsfall an.
Sowohl Amazon Redshift als auch Amazon RDS ermöglichen Ihnen bei Auslagerungen der Datenbankverwaltung den Betrieb herkömmlicher relationaler Datenbanken in der Cloud. Für Ihre Situation bietet sich Amazon Redshift an, denn der Service nutzt die Leistungsfähigkeit und Ressourcen mehrerer Knoten und eine Vielzahl von Optimierungen. Diese ermöglichen im Vergleich zu herkömmlichen Datenbanken für Berichterstellung und Analyse bei sehr großen Datenmengen deutliche Verbesserungen. Amazon Redshift bietet eine Option zur horizontalen Skalierung, sobald die Komplexität Ihrer Daten und Abfragen zunimmt oder Sie verhindern möchten, dass die Berichterstellungs- und Analyseverarbeitung die Leistung Ihrer OLTP-Verarbeitung (Online-Transaction Processing) stört.

Sie können Daten aus verschiedenen Datenquellen in Amazon Redshift laden, beispielsweise aus Amazon S3, Amazon DynamoDB, Amazon EMR, AWS Data Pipeline und von SSH-fähigen Hosts in Amazon EC2 oder in lokalen Bereitstellungen. Amazon Redshift lädt die Daten parallel in die einzelnen Rechenknoten, um die Rate zu maximieren, mit der Daten in Ihrem Data-Warehouse-Cluster aufgenommen werden können. Indem Sie den COPY-Befehl verwenden, laden Sie Daten parallel aus Amazon EMR, Amazon DynamoDB oder jedem anderen SSH-fähigen Host direkt in Amazon Redshift. Darüber hinaus haben viele Anbieter von ETL-Lösungen Amazon Redshift für die Nutzung mit ihren Tools zertifiziert. Eine Reihe von ihnen bietet kostenlose Testversionen an, um Ihnen die ersten Schritte beim Laden Ihrer Daten zu erleichtern.

Weiterhin steht Ihnen mit Amazon QuickSight ein sehr schneller Business-Intelligence-Service auf Cloud-Basis zur Verfügung, mithilfe Sie Visualisierungen aufbauen, Ad-hoc-Analysen ausführen und schnell Geschäftserkenntnisse aus Ihren Daten gewinnen können. Amazon QuickSight verwendet eine neue, parallele In-memory Technologie, um leistungsfähige Berechnungen schnell auszuführen und Visualisierungen ohne Zeitverlust zu erstellen. Amazon Quick-Sight ist automatisch integriert mit AWS-Datenservices wie Amazon RDS, Amazon Redshift oder Amazon.
11.12.2016/ln

Tipps & Tools

Download der Woche: DataNumen Disk Image [25.01.2017]

Images von Festplatten oder anderen Datenträgern sind wichtig für IT-Profis, um sie als Quelle zum Wiederaufspielen von Daten zu nutzen oder um beschädigte Sektoren von Festplatten zu ersetzen. Mit dem kostenfreien Tool 'DataNumen Disk Image' können Sie ganze Festplatten oder einzelne Partitionen klonen. Für eine komfortable Bedienung sorgt die Batch-Funktion, die mehrere Backup- Quellen in Reihe ermöglicht. [mehr]

Synology-NAS kostenlos zertifizieren [22.01.2017]

Viele Unternehmen greifen in Außenstelle auf ein kleineres NAS zurück. Der Fernzugriff auf das Gerät erfolgt über eine abgesicherte HTTPS-Verbindung. In Ermangelung eines SSL-Zertifikats schlagen jedoch beim Zugriff mittlerweile alle Browser Alarm und stufen die Verbindung als unsicher ein. Synology bietet für seine Produkte, die unter dem aktuellsten Betriebssystem DSM 6 laufen, die Möglichkeit bietet, direkt über die GUI ein kostenloses Zertifikat von Let's Encrypt zu installieren. Der Ausstellungsprozess ist jedoch nicht ganz einfach und schlägt ohne die richtigen Schritte schnell fehl. [mehr]

Fachartikel

Hochverfügbarkeit im Rechenzentrum [8.02.2017]

Moderne All-Flash-Arrays spielen in unternehmenskritischen Umgebungen nicht nur ihre Stärken in Sachen Performance aus. Sie leisten auf verschiedener Ebene einen entscheidenden Beitrag zur Hochverfügbarkeit. Dies beginnt auf unterster Speicherebene innerhalb jeder einzelnen Flash-Zelle. Hinzu kommen der objektbasierte RAID- und NVRAM-Schutz. Auf höchster Ebene trägt – je nach Entfernung – synchrone oder asynchrone Spiegelung an einen entfernten RZ-Standort zu einem maximalen Schutz der Daten bei. Dieser Beitrag erklärt die technischen Grundlagen. [mehr]

Buchbesprechung

SQL Hacking

von Justin Clarke et al.

Anzeigen