É«¿Ø´«Ã½

Skip to Content

Was ist ein Data Warehouse?

Was ist ein Data Warehouse?

Ein Data Warehouse ist ein Storage-System, das daf¨¹r optimiert ist, strukturierte Daten zu speichern, um die Hochgeschwindigkeits-SQL-Abfragen durchzuf¨¹hren, die zum schnellen Bereitstellen von Business-Intelligence n?tig sind. Vom Verarbeiten von Hochgeschwindigkeits-Transaktionen hin zu vorausschauenden Analysen: Data Warehouses sind seit Jahrzehnten faktisch der Storage-Standard, den Unternehmen verwenden, um ihre BI zu unterst¨¹tzen.

Die Vorteile von Data Warehouses

Data Warehouses haben unter anderem folgende Vorteile:

  • Konsolidierung strukturierter Daten aus mehreren verteilten Quellen?
  • schnelle analytische Abfragen von relationalen Datenbanken
  • eine dedizierte Storage-L?sung f¨¹r g¨¹nstigere Abfragen und schnellere Berichterstellung

FlashBlade selbst testen

Erleben Sie eine Self-Service-Instanz von Pure1? zum Verwalten von Pure FlashBlade?, der fortschrittlichsten L?sung der Branche, die nativen skalierbaren Datei- und Objekt-Storage liefert.

Test anfordern

So funktionieren Data Warehouses

Die Logistik der Erfassung von Daten aus unterschiedlichen Teilen eines Unternehmens zum Extrahieren n¨¹tzlicher Informationen kann in ihrer Komplexit?t mit Ihrem Unternehmen wachsen. Data Warehouses k?nnen Ihrem Unternehmen eine zuverl?ssige M?glichkeit bieten, diese Informationen in eine einzige Datenbank und ein Datenmodell zu konsolidieren, damit?Analysten ihre Abfragen ausf¨¹hren k?nnen.?

Und so funktioniert das Ganze:

  1. Extrahieren: Sammeln Sie Rohdaten aus den verteilten Ressourcen in Ihrem Unternehmen (z.?B. ERP, CRM, Marketing) in Bereitstellungsdatenbanken.
  2. Transformieren: Daten aus der Bereitstellungsebene werden in eine Integrationsebene ¨¹bertragen, in der Daten kombiniert und in einen ODS (Operational Data Store) umgewandelt werden.
  3. Laden: Daten werden aus der Integrationsebene in das Data Warehouse verschoben, indem das Schema definiert wird, das Ihre Analysten f¨¹r ihre SQL-Abfragen verwenden m?chten, bevor sie in eine relationale Datenbank geschrieben werden (Schema-on-Write).?

Die Datenbank, mit der Sie in einem Data Warehouse interagieren, ist relational, was bedeutet, dass Daten strukturiert sind, also in Tabellen aus Spalten und Zeilen gespeichert werden. Diese Tabellen werden entsprechend dem Schema organisiert, das?w?hrend des Schreibvorgangs definiert wurde.?

Wenn der Transformationsschritt von einem ODS gehandhabt wird, der Data-Warehouse-extern ist, spricht man von ?ETL¡° (Extract, Transform, Load). Wenn das Data Warehouse die Transformationen intern bew?ltigt, spricht man von ?ELT¡° (Extract, Load, Transform). Unabh?ngig davon, ob Sie ETL oder ELT verwenden, erfordern Data Warehouses strukturierte Daten und Schema-on-Write, um mit relationalen Datenbanken arbeiten zu k?nnen.

Wozu werden Data Warehouses verwendet?

Data Warehouses werden beispielsweise in folgenden F?llen genutzt:

  • OLTP (Online Transaction Processing) Ein Data Warehouse kann f¨¹r Datenintegrit?t und schnelle Abfragen optimiert werden, um eine gro?e Menge an kurzen Datentransaktionen zu verarbeiten. Ein Beispiel hierf¨¹r sind Transaktionen, die auf einer Hochfrequenzhandelsplattform stattfinden.?
  • OLAP (Online Analytical Processing): Sie k?nnen ein Data Warehouse f¨¹r schnellere komplexe Abfragen f¨¹r ein relativ geringes Volumen an Transaktionen optimieren. Das ist im Grunde die Art von Data Warehouse, die ein Analyst verwendet, um BI-Berichte zu generieren.
  • Vorausschauende Analysen: Ein OLAP-System kann daf¨¹r optimiert werden, zuk¨¹nftige Ereignisse zu prognostizieren und?¨C h?ufig mithilfe von ML-Algorithmen?¨C Was-w?re-wenn-Szenarios f¨¹r Ihr Unternehmen zu generieren.

Da bei Data Warehouses Schema-on-Write zum Einsatz kommt, ist es wichtig, zu wissen, welche Art von Abfragen Sie durchf¨¹hren m?chten, bevor Sie ein Schema zu einem Data Warehouse hinzuf¨¹gen. Um die Komplexit?t verteilter Datenquellen zu bew?ltigen, k?nnen Sie ein Data Warehouse in Data Marts segmentieren, um Hardware- und Software-Ressourcen f¨¹r bestimmte Gesch?ftsfunktionen wie z.?B. CRM zu reservieren.

Data Warehouse, Datenpool und Data Hub

Diese drei Konzepte m?gen zwar wirken, als k?nnen sie gegeneinander ausgetauscht werden, aber es ist wichtig, ihre Unterschiede zu verstehen:

  • Data Warehouse: Ein einzelnes Repository zum Integrieren und Speichern strukturierter Daten aus mehreren unstrukturierten Datenquellen in Ihrer gesamten Organisation.
  • Datenpool: Ein einzelnes ungefiltertes Repository aus allen strukturierten und unstrukturierten Rohdatenquellen in einer Organisation (einschlie?lich Data Warehouses). Die Daten m¨¹ssen erst noch verarbeitet werden, damit BI-Erkenntnisse extrahiert werden k?nnen.?
  • Data Hub: Eine einzelne Schnittstelle, die alle Daten?¨C sowohl strukturierte als auch unstrukturierte Daten?¨C in eine zentrale zug?ngliche Datenebene konsolidiert. Ein Data Hub unterscheidet sich darin von einem Data Warehouse, dass er auch Betriebsdaten verarbeiten kann, und unterscheidet sich darin von einem Datenpool, dass er in der Lage ist, Daten in mehreren Formaten bereitzustellen.?

Data Hubs bieten auch die Daten-Governance, die n?tig ist, um das Teilen von Daten zwischen unterschiedlichen Endpunkten zu optimieren. Auf diese Weise konsolidieren Data Hubs Datenpools und Data Warehouses in einer einzigen Zugriffsebene. Die Datenverarbeitung erfolgt im Data Hub, wodurch Ihre Organisation einen zentralen Ort erh?lt, an dem BI-Erkenntnisse extrahiert werden.

Weshalb sollten Sie sich im Hinblick auf Ihre Data-Warehouse-Anforderungen f¨¹r É«¿Ø´«Ã½ entscheiden?

Wenn Sie eine neue OLAP- oder OLTP-Pipeline zu Ihrer vorhandenen Data-Warehouse-Infrastruktur hinzuf¨¹gen m¨¹ssen, kann es an der Zeit sein, zu ¨¹berlegen, ob Sie in eine Modern Data Experience? mit den All-Flash-L?sungen von É«¿Ø´«Ã½ investieren sollten.?

Als der erste Data Hub der Branche kann É«¿Ø´«Ã½? ?FlashBlade?? nicht nur die Analyse- und Berichterstellungs-Workloads eines Data Warehouse verarbeiten, sondern liefert auch die wichtigsten Eigenschaften eines Data Hub:

  • nahtlose Datenfreigabe ¨¹ber alle Datenendpunkte hinweg
  • einheitlicher File- und Object-Storage
  • die F?higkeit, Betriebsdaten in Echtzeit zu verarbeiten
  • nativ f¨¹r die Skalierung ausgelegt
  • f¨¹r die Bereitstellung multidimensionaler Performance f¨¹r alle Datentypen entwickelt
  • massiv-parallel von der Software bis zur Hardware
07/2025
Scalable Lakehouse Analytics with É«¿Ø´«Ã½ and Starburst
From Hadoop sprawl to data lakehouse: Starburst + FlashBlade Object Storage delivers performance, cost, and operational gains in a scalable solution.
Referenzarchitektur
17 pages

Wichtige Ressourcen und Veranstaltungen durchsuchen

VIDEO
Sehen Sie selbst: Der Wert einer Enterprise Data Cloud

Charlie Giancarlo erkl?rt, warum die Zukunft in der Verwaltung von Daten und nicht in der Verwaltung von Storage liegt. Erfahren Sie, wie ein einheitlicher Ansatz IT-Abl?ufe in Unternehmen transformiert.

Jetzt ansehen
RESSOURCE
Herk?mmlicher Storage kann die Zukunft nicht befl¨¹geln.

Moderne Workloads erfordern KI-f?hige Geschwindigkeit, Sicherheit und Skalierbarkeit. Ist Ihr Stack darauf vorbereitet?

Bewertung durchf¨¹hren
PURE360-DEMOS
É«¿Ø´«Ã½ erkunden, kennenlernen und erleben.

?berzeugen Sie sich mit On-Demand-Videos und -Demos von den M?glichkeiten von É«¿Ø´«Ã½.

Demos ansehen
THOUGHT LEADERSHIP
Der Innovationswettlauf

Branchenf¨¹hrer, die an vorderster Front der Storage-Innovationen stehen, geben Einblicke und Ausblicke.

Mehr erfahren
Ihr Browser wird nicht mehr unterst¨¹tzt!

?ltere Browser stellen h?ufig ein Sicherheitsrisiko dar. Um die bestm?gliche Erfahrung bei der Nutzung unserer Website zu erm?glichen, f¨¹hren Sie bitte ein Update auf einen dieser aktuellen Browser durch.