É«¿Ø´«Ã½

Skip to Content
Anf?ngerleitfaden zu Big Data

Strukturierte Daten versus unstrukturierte Daten

In den letzten zehn Jahren haben sich unsere Definition und unser Verst?ndnis von Daten dramatisch ver?ndert ¨C zum Teil aufgrund der zunehmenden Verf¨¹gbarkeit neuer Tools zum Lesen, Speichern und Analysieren unstrukturierter Daten.

In der Vergangenheit wurden unstrukturierte Daten aufgrund der Schwierigkeit, sie zu interpretieren, oft nicht umfassend genutzt. Diese neuen Technologien haben es einfacher gemacht, unstrukturierte Daten nicht nur zu verstehen, sondern auch wertvolle Erkenntnisse aus diesem Informationsschatz zu gewinnen.

wird das Gesamtvolumen der weltweit erstellten, erfassten, kopierten und verbrauchten Daten bis 2024 jedes Jahr 149?Zettabyte ¨¹berschreiten ¨C und ein Gro?teil davon wird unstrukturiert sein. Jedes Unternehmen wird vom Aufbau von Funktionen zur Analyse unstrukturierter Daten profitieren. Der erste Schritt auf diesem Weg besteht einfach darin, zu verstehen, was strukturierte Daten im Gegensatz zu unstrukturierten Daten sind.

Hier finden Sie eine kurze Zusammenfassung des Unterschieds zwischen den beiden Arten von Daten. Tiefergehende Erkl?rungen werden folgen:

Merkmal

Strukturierte Daten

Unstrukturierte Daten

Beschaffenheit der Daten

In der Regel quantitativ

In der Regel qualitativ

Datenmodell

Vordefiniert. Nach seiner Definition und nachdem einige Daten gespeichert wurden, ist es schwierig, das Modell zu ?ndern.

Bei unstrukturierten Daten gibt es kein bestimmtes Schema. Das Datenmodell ist sehr flexibel.

Datenformat

Es ist eine begrenzte Anzahl von Datenformaten verf¨¹gbar.

F¨¹r unstrukturierte Daten sind viele unterschiedliche Datenformate verf¨¹gbar.

Datenbank

SQL-basierte relationale Datenbanken werden verwendet.

NoSQL-Datenbanken ohne spezifisches Schema werden verwendet.

Suche

Sehr einfaches Suchen und Finden von Daten innerhalb der Datenbank oder des Datensatzes

Sehr schwierig, nach bestimmten Daten zu suchen, da sie unstrukturiert sind

Analyse

Sehr einfach zu analysieren, da es sich um quantitative Daten handelt

Sehr schwierig zu analysieren, selbst mit vorhandenen Software-Tools

Storage-Methode

Data Warehouses werden f¨¹r strukturierte Daten verwendet.

Datenpools werden zum Speichern unstrukturierter Daten verwendet.

Slide

Was sind strukturierte Daten?

Strukturierte Daten weisen ein wohldefiniertes Schema f¨¹r die darin enthaltenen Informationen auf. Eine extrem einfache Definition lautet: Alle Daten, die in einem Tabellenkalkulationsprogramm wie Google Sheets oder Microsoft Excel dargestellt werden k?nnen, sind strukturierte Daten.

In diesem Beispiel k?nnen die Daten als Zeilen und Spalten dargestellt werden. Jede Spalte steht f¨¹r ein anderes Attribut, w?hrend jede Zeile die mit dem Attribut verbundenen Daten f¨¹r eine einzelne Instanz enth?lt. Zeilen und Spalten bilden eine Tabelle, auf die einfach Bezug genommen werden kann.

Verschiedene Tabellen k?nnen miteinander verbunden werden, d.?h. man kann sie aufgrund der in beiden Tabellen vorhandenen gemeinsame Spalte als zusammengeh?rig betrachten.

Werden mehrere Tabellen nacheinander und in Kombination miteinander in Beziehung gesetzt, entsteht eine relationale Datenbank. Zum Beispiel k?nnen die Kunden-, Verkaufs- und Bestandsdaten eines Kaufhauses als strukturierte Daten betrachtet werden, die in einer relationalen Datenbank gespeichert sind.

  • F¨¹r jeden Kunden gibt es eine Kunden-ID sowie Felder f¨¹r dessen Namen, Kontaktnummer, Kreditkarteninformationen, Adresse usw.
  • Die Kundendatenbank kann mit der Datenbank der Verk?ufe verbunden werden, wobei zu den Attributen der Zeitpunkt des Kaufs, die gekauften Artikelcodes, der Gesamtbetrag der Ausgaben, die Kunden-ID usw. geh?ren. Die beiden Tabellen werden mit dem gemeinsamen Attribut, der Kunden-ID, verbunden.
  • Schlie?lich kann die Verkaufsdatenbank mit der Bestandsdatenbank ¨¹ber den Artikelcode als gemeinsamem Attribut verbunden werden, wodurch alle drei Tabellen effektiv zu einer relationalen Datenbank verbunden werden.

Strukturierte Daten wie diese werden in der Regel in relationalen Datenbankmanagementsystemen (RDBMS) gespeichert. Datenbanken k?nnen mit der Structured Query Language (SQL) geschrieben, gelesen und bearbeitet werden, einer Sprache, die von IBM in den 1970er Jahren zur Unterst¨¹tzung seiner Mainframe-Datenbanken entwickelt wurde (wobei sie urspr¨¹nglich als Sequence English Query Language oder SEQUEL bekannt war). Sie wurde so genannt, da sie sich ziemlich ?hnlich wie die englische Sprache liest. SQL in seiner heutigen Form wurde von Relational Software, Inc. (jetzt Oracle genannt), bekannt gemacht.

Was sind unstrukturierte Daten?

Alle Daten, die keine strukturierten Daten sind, k?nnen als unstrukturierte Daten klassifiziert werden. Sch?tzungen zufolge werden bis 2025 80?% der Daten, die uns begegnen, unstrukturierte Daten in Form von Texten, Audioaufnahmen, Bildern oder Videos sein1.

Kurz gesagt: . Sie sind h?ufig:

  • digitalen Ursprungs
  • st?ndig im Entstehen begriffen und in Bewegung
  • kombiniert, multimodal und interoperabel
  • f¨¹r besseren Schutz geografisch verteilt

Unstrukturierten Daten k?nnen einige Metadaten zugeordnet sein, die ihrerseits eine Struktur haben k?nnen. Ein Video kann z. B. Metadaten zu Videoaufl?sung, Bitrate, Bildern pro Sekunde (FPS), Videoeigent¨¹mer usw. enthalten. Aber das Video an sich ist unstrukturiert. Wenn mit unstrukturierten Daten einige strukturierte Metadaten verbunden sind, spricht man gelegentlich von halbstrukturierten Daten.

Wenn man sich das Beispiel eines YouTube-Videos genauer ansieht, sind einige Metadaten vorhanden, z. B. die Upload-Uhrzeit, das Upload-Datum, die Anzahl der Aufrufe (teilweise oder vollst?ndig), die Anzahl der Likes und Dislikes usw. Aber der Inhalt innerhalb des Videotitels, der Videobeschreibung und des Videos selbst ist unstrukturiert. Er hat einen qualitativen Aspekt, der nicht rein durch Zahlen erfasst werden kann.

Die am h?ufigsten verwendete Datenbank f¨¹r unstrukturierte Daten ist NoSQL. NoSQL steht f¨¹r ?not only SQL¡° (nicht nur SQL) und weist darauf hin, dass die Datenbank ein breiteres Spektrum an Daten verarbeiten kann, als es SQL-Datenbanken k?nnen. F¨¹r NoSQL-Datenbanken gibt es kein Schema und keine tabellarische Struktur; es handelt sich lediglich um eine Sammlung von Daten, die gruppiert sind.

?

Storage f¨¹r unstrukturierte Daten mit UFFO

Doch auch wenn unstrukturierte Daten wichtige Erkenntnisse mit gro?em Transformationspotenzial liefern k?nnen, gibt es Herausforderungen bei der Handhabung dieser Daten. Die fortschrittliche UFFO-Storage-L?sung von Pure, É«¿Ø´«Ã½? FlashBlade?, bietet die Geschwindigkeit, die man mit der Flash-Storage-Technologie verbindet, sowie die F?higkeit, jede Architektur flexibel zu skalieren. M?chten Sie sie sich n?her ansehen? Pure bietet eine kostenlose Testversion von Pure FlashBlade an, sodass Sie die L?sung unverbindlich testen k?nnen.

?hnliche Produkte und L?sungen

L?sung
Datenanalysen

1https://www.cio.com/article/3406806/ai-unleashes-the-power-of-unstructured-data.html

04/2025
Compliance Assessment Report: É«¿Ø´«Ã½ FlashBlade File Storage
É«¿Ø´«Ã½ FlashBlade File Storage: SEC 17a-4(f), SEC 18a-6(e), FINRA 4511(c) and CFTC 1.31(c)-(d) by Cohasset Associates Inc.
Analystenbericht
29 pages

Wichtige Ressourcen und Veranstaltungen durchsuchen

THOUGHT LEADERSHIP
Der Innovationswettlauf

Branchenf¨¹hrer, die an vorderster Front der Storage-Innovationen stehen, geben Einblicke und Ausblicke.

Mehr erfahren
ANALYSTENBERICHT
Planen Sie Ihre cyberresiliente Zukunft

Entdecken Sie Strategien zur Zusammenarbeit, um Investitionen in Cybersicherheit optimal zu nutzen und eine schnelle Reaktionsf?higkeit sowie Wiederherstellung sicherzustellen.

Bericht lesen
QUELLE
Die Zukunft des Storage: Neue Prinzipien f¨¹r das KI-Zeitalter

Erfahren Sie, wie neue Herausforderungen wie KI die Anforderungen an den Daten-Storage ver?ndern und ein neues Denken sowie einen modernen Ansatz f¨¹r den Erfolg erforderlich machen.

E-Book herunterladen
QUELLE
Kaufen Sie keinen Storage mehr, sondern setzen Sie stattdessen auf Plattformen.

Untersuchen Sie die Anforderungen, die Komponenten und den Auswahlprozess f¨¹r Storage-Plattformen in Unternehmen.

Bericht lesen
KONTAKTIEREN SIE UNS
Fragen, Kommentare?

Haben Sie eine Frage oder einen Kommentar zu Produkten oder Zertifizierungen von Pure?? Wir helfen Ihnen gerne!

Termin f¨¹r Demo vereinbaren

Vereinbaren Sie einen Termin f¨¹r eine Live-Demo und sehen Sie selbst, wie Pure Ihnen helfen kann, Ihre Daten in ¨¹berzeugende Ergebnisse zu verwandeln.?

Rufen Sie uns an:?+49 89 26200662
Presse:
?pr@purestorage.com

?

É«¿Ø´«Ã½ Germany GmbH

Mies-van-der-Rohe-Stra?e 6

80807 M¨¹nchen

Deutschland

info@purestorage.com

SCHLIESSEN
Ihr Browser wird nicht mehr unterst¨¹tzt!

?ltere Browser stellen h?ufig ein Sicherheitsrisiko dar. Um die bestm?gliche Erfahrung bei der Nutzung unserer Website zu erm?glichen, f¨¹hren Sie bitte ein Update auf einen dieser aktuellen Browser durch.