É«¿Ø´«Ã½

Skip to Content
Guide du Big Data pour les d¨¦butants

Donn¨¦es structur¨¦es vs. donn¨¦es non structur¨¦es

Ces dix derni¨¨res ann¨¦es, notre d¨¦finition et notre compr¨¦hension des donn¨¦es a consid¨¦rablement ¨¦volu¨¦ ¡ª notamment gr?ce aux outils, toujours plus nombreux, qui permettent de lire, stocker et analyser des donn¨¦es non structur¨¦es.

Par le pass¨¦, les donn¨¦es non structur¨¦es ¨¦taient souvent sous-utilis¨¦es, en raison des difficult¨¦s d¡¯interpr¨¦tation associ¨¦es. Ces nouvelles technologie ont permis non seulement de mieux comprendre cette pr¨¦cieuse masse de donn¨¦es, mais aussi d¡¯en extraire des informations strat¨¦giques.

, le volume total de donn¨¦es cr¨¦¨¦es, captur¨¦es, copi¨¦es et consommer dans le monde d¡¯ici 2024 d¨¦passera 149 zettaoctets par an ¡ª la majorit¨¦ d¡¯entre elles ¨¦tant non structur¨¦es. Toutes les entreprises auront ¨¤ gagner ¨¤ d¨¦velopper leurs capacit¨¦s d¡¯analyse de ces donn¨¦es non structur¨¦es. La premi¨¨re ¨¦tape consiste ¨¤ bien distinguer les donn¨¦es structur¨¦es et non structur¨¦es.

Voici un tableau r¨¦capitulatif rapide des diff¨¦rences, suivi d¡¯explications plus d¨¦taill¨¦es.

°ä²¹°ù²¹³¦³Ù¨¦°ù¾±²õ³Ù¾±±ç³Ü±ð²õ

Donn¨¦es structur¨¦es

Donn¨¦es non structur¨¦es

Nature des donn¨¦es

G¨¦n¨¦ralement quantitatives

G¨¦n¨¦ralement qualitatives

Mod¨¨le de donn¨¦es

Pr¨¦d¨¦finies?; une fois le mod¨¨le d¨¦fini et quelques donn¨¦es stock¨¦es, il est difficile de le modifi¨¦

Aucun sch¨¦ma particulier, le mod¨¨le de donn¨¦es est tr¨¨s flexible

Format des donn¨¦es

Nombre de formats disponibles limit¨¦

Grande vari¨¦t¨¦ de formats disponibles

Base de donn¨¦es

Bases de donn¨¦es relationnelles bas¨¦es sur SQL

Bases de donn¨¦es NoSQL, sans sch¨¦ma sp¨¦cifique

Recherche

Recherche ais¨¦e dans la base de donn¨¦es ou l¡¯ensemble de donn¨¦es

Recherche de donn¨¦es particuli¨¨res tr¨¨s difficile en raison de leur nature non structur¨¦e

Analyse

Analyse tr¨¨s simple, ¨¦tant donn¨¦e la nature quantitative des donn¨¦es

Analyse tr¨¨s complexe, m¨ºme avec les outils logiciels existants

M¨¦thode de stockage

Data warehouses

Data lakes

Slide

Que sont les donn¨¦es structur¨¦es??

Les donn¨¦es structur¨¦es pr¨¦sentent un sch¨¦ma bien d¨¦fini, dans lequel les informations sont mises en forme. Pour sch¨¦matiser, les donn¨¦es susceptibles d¡¯¨ºtre pr¨¦sent¨¦es dans des tableurs tels que Google Sheets ou Microsoft Excel sont des donn¨¦es structur¨¦es.

Selon cet exemple, les donn¨¦es peuvent ¨ºtre synth¨¦tis¨¦es sous forme de lignes et de colonnes. Chaque colonne repr¨¦sente un attribut, et chaque ligne permet d¡¯associer ou non un ¨¦l¨¦ment de donn¨¦es pr¨¦cis avec les diff¨¦rents attributs. Ces lignes et colonnes forment un tableau tr¨¨s facile ¨¤ utiliser.

Il est possible de relier diff¨¦rents tableaux ¡ª ¨¤ condition qu¡¯ils aient des colonnes communes.

Plusieurs tableaux associ¨¦s, successivement ou par combinaison, forment une base de donn¨¦es relationnelle. Ainsi, les donn¨¦es client, commerciales et d¡¯inventaire d¡¯une boutique peuvent ¨ºtre consid¨¦r¨¦es comme une base de donn¨¦es relationnelle.

  • Chaque client dispose d¡¯un ID client, ainsi que de champs contenant son nom, son num¨¦ro de t¨¦l¨¦phone, son num¨¦ro de carte de cr¨¦dit, son adresse, etc.
  • La base de donn¨¦es clients peut ¨ºtre reli¨¦e ¨¤ la base de donn¨¦es commerciale ¨¤ partir d¡¯attributs tels que la date d¡¯achat, la r¨¦f¨¦rence des articles achet¨¦s, le montant total d¨¦pens¨¦, l¡¯ID client, etc. G¨¦n¨¦ralement, les deux tableaux sont reli¨¦s par l¡¯attribut commun d¡¯ID client.
  • Enfin, la base de donn¨¦es commerciale peut ¨ºtre reli¨¦e ¨¤ la base de donn¨¦es d¡¯inventaire via l¡¯attribut commun du code d¡¯article, de sorte que les trois tableaux sont int¨¦gr¨¦s ¨¤ une seule et m¨ºme base de donn¨¦es relationnelle.

Ces donn¨¦es structur¨¦es sont g¨¦n¨¦ralement stock¨¦es dans des syst¨¨mes de gestion de base de donn¨¦es relationnelle (RDBMS). Ces bases de donn¨¦es peuvent ¨ºtre modifi¨¦es, consult¨¦es et manipul¨¦es ¨¤ l¡¯aide du langage SQL (Structured Query Language), d¨¦velopp¨¦ par IBM dans les ann¨¦es 1970 pour prendre en charge ses bases de donn¨¦es centrales. Ce langage s¡¯appelait alors Sequence English Query Language, ou SEQUEL, car il se lisait presque comme la langue anglaise. Dans sa forme actuelle, SQL a ¨¦t¨¦ popularis¨¦ par Relational Software, Inc. (aujourd¡¯hui appel¨¦e Oracle).

Que sont les donn¨¦es non structur¨¦es??

Toutes les donn¨¦es qui ne sont pas structur¨¦es peuvent ¨ºtre cat¨¦goris¨¦es comme non structur¨¦es. On estime que d¡¯ici 2025, 80?% des donn¨¦es que nous utilisons - que ce soit sous forme de texte, de son, d¡¯image ou de vid¨¦o - seront non structur¨¦es1.

En somme, . Elles sont souvent?:

  • d¡¯origine num¨¦rique et impr¨¦visibles
  • en cr¨¦ation et en mouvement constants
  • m¨¦lang¨¦es, multimodales et interop¨¦rables
  • g¨¦odistribu¨¦es pour une meilleure protection

Les donn¨¦es non structur¨¦es sont associ¨¦es ¨¤ des m¨¦tadonn¨¦es qui peuvent, quant ¨¤ elles, ¨ºtre structur¨¦es. Ainsi, une vid¨¦o a des m¨¦tadonn¨¦es qui correspondent ¨¤ la r¨¦solution, au d¨¦bit binaire, au nombre d¡¯images par seconde, au propri¨¦taire, etc. Mais la vid¨¦o en elle-m¨ºme est non structur¨¦e. Des donn¨¦es non structur¨¦es associ¨¦es ¨¤ des m¨¦tadonn¨¦es structur¨¦es sont g¨¦n¨¦ralement appel¨¦es ??donn¨¦es semi-structur¨¦es??.

Si l¡¯on prend l¡¯exemple d¡¯une vid¨¦o YouTube, celle-ci pr¨¦sente des m¨¦tadonn¨¦es - notamment l¡¯heure de chargement, la date de chargement, le nombre de vue (partiel ou total), le nombre de ??j¡¯aime?? et de ??je n¡¯aime pas??, etc. Cependant, le titre de la vid¨¦o, sa description et la vid¨¦o en elle-m¨ºme sont non structur¨¦s. Ils ont un aspect qualitatif qui ne peut ¨ºtre exprim¨¦ seulement par des nombres.

Pour les donn¨¦es non structur¨¦es, on utilise g¨¦n¨¦ralement des bases de donn¨¦es NoSQL. NoSQL signifie ??pas seulement SQL??, ce qui indique que la base de donn¨¦es est capable de prendre en charge une plus large gamme de donn¨¦es que les bases de donn¨¦es SQL. Les bases de donn¨¦es NoSQL n¡¯ont pas de structure sch¨¦matique ou tabulaire?; il s¡¯agit juste d¡¯un ensemble de donn¨¦es regroup¨¦es.

?

Stockage de donn¨¦es non structur¨¦es avec UFFO

Si les donn¨¦es non structur¨¦es sont susceptible de fournir des informations strat¨¦giques dot¨¦es d¡¯un vrai potentiel de transformation, elles ne sont pas simples ¨¤ ma?triser. La solution de stockage avanc¨¦e UFFO de Pure, É«¿Ø´«Ã½? FlashBlade?, garantit la vitesse de la technologie flash, associ¨¦e ¨¤ la possibilit¨¦ de dimensionner n¡¯importe quelle architecture de mani¨¨re agile. Si vous souhaitez en savoir plus, Pure propose un essai gratuit de Pure FlashBlade. Vous pourrez ainsi tester la solution sans engagement.

Produits et solutions associ¨¦s

Solution
Analytique de donn¨¦es

1https://www.cio.com/article/3406806/ai-unleashes-the-power-of-unstructured-data.html

Nous vous recommandons ¨¦galement¡­

04/2025
Compliance Assessment Report: É«¿Ø´«Ã½ FlashBlade File Storage
É«¿Ø´«Ã½ FlashBlade File Storage: SEC 17a-4(f), SEC 18a-6(e), FINRA 4511(c) and CFTC 1.31(c)-(d) by Cohasset Associates Inc.
Rapport d¡¯analyste
29 pages

Parcourez les ressources cl¨¦s et les ¨¦v¨¦nements

LEADERSHIP ?CLAIR?
La course ¨¤ l¡¯innovation

Les derni¨¨res informations strat¨¦giques et perspectives fournies par des leaders du secteur, pionniers de l¡¯innovation en mati¨¨re de stockage.

En savoir plus
RAPPORT D¡¯ANALYSTE
Pr¨¦parer votre cyber-r¨¦silience future

D¨¦couvrez des strat¨¦gies de collaboration qui vous aideront ¨¤ tirer le meilleur parti de vos investissements dans la cybers¨¦curit¨¦ et ¨¤ garantir une r¨¦action et une r¨¦cup¨¦ration rapides.

Lire le rapport
RESSOURCE
L¡¯avenir du stockage?: les nouvelles r¨¨gles de l¡¯¨¨re de l¡¯IA

D¨¦couvrez comment les nouveaux d¨¦fis comme l¡¯IA transforment les besoins de stockage des donn¨¦es et n¨¦cessitent de repenser les processus et d¡¯adopter une approche moderne pour r¨¦ussir.

Obtenir l¡¯e-book
RESSOURCE
D¨¦laisser l¡¯achat de stockage pour favoriser l¡¯adoption de plateformes

D¨¦couvrez les besoins, les composants et le processus de s¨¦lection des plateformes de stockage d¡¯entreprise.

Lire le rapport
CONTACTEZ-NOUS
Des questions, des commentaires??

Vous avez des questions ou des commentaires concernant des produits ou certifications?Pure??? Nous sommes l¨¤ pour vous aider.

Planifier une d¨¦mo

Planifiez une d¨¦mo en direct et d¨¦couvrez comment Pure peut vous aider ¨¤ transformer vos donn¨¦es.?

°Õ¨¦±ô.?:?+33 1 89 96 04 00

Services M¨¦dias?:?pr@purestorage.com

?

É«¿Ø´«Ã½ France

32 rue Guersant

75017 Paris

info@purestorage.com

?

FERMER
Votre navigateur n¡¯est plus pris en charge !

Les anciens navigateurs pr¨¦sentent souvent des risques de s¨¦curit¨¦. Pour profiter de la meilleure exp¨¦rience possible sur notre site, passez ¨¤ la derni¨¨re version de l¡¯un des navigateurs suivants.