É«¿Ø´«Ã½

Skip to Content
Guide

Guide du Big Data pour les d¨¦butants

Qu¡¯est-ce que le Big Data et comment fonctionne-t-il?? Approfondissez avec nous votre compr¨¦hension du Big Data et des technologies n¨¦cessaires pour en extraire des informations strat¨¦giques exploitables pour votre entreprise.

Qu¡¯est-ce que le Big Data??

Les entreprises modernes recueillent d¡¯immenses quantit¨¦s de donn¨¦es provenant de diverses sources, qu¡¯elles doivent souvent analyser en temps r¨¦el. Le concept de Big Data renvoie aux donn¨¦es trop volumineuses, trop rapides ou trop complexes pour pouvoir ¨ºtre trait¨¦es ¨¤ l¡¯aide de techniques traditionnelles. Mais il induit ¨¦galement de nombreuses technologies et strat¨¦gies rendues possibles par ce volume de donn¨¦es, notamment en mati¨¨re d¡¯extraction d¡¯informations?: analytique pr¨¦dictive, Internet des Objets, intelligence artificielle, et bien plus encore.

, le march¨¦ mondial du Big?Data devrait atteindre une valeur de 156?milliards de dollars d¡¯ici 2026 ¡ª et que les entreprises ont de nombreuses raisons de participer ¨¤ l¡¯aventure. D¨¦couvrez ce qu¡¯est le Big Data, d¡¯o¨´ il vient, comment il peut ¨ºtre utilis¨¦, et comment les entreprises peuvent pr¨¦parer leurs infrastructures informatiques ¨¤ en tirer le meilleur parti.

Articles connexes

Les trois ??V?? du Big Data

Bien que le concept de Big Data existe depuis longtemps, c¡¯est l¡¯analyste Doug?Laney qui, en 2001, a ¨¦t¨¦ le premier ¨¤ ¨¦voquer les trois V du Big Data. En voici la liste?:

  • Volume?: quantit¨¦ de donn¨¦es ¨¤ traiter (g¨¦n¨¦ralement de l¡¯ordre du gigaoctet, de l¡¯exaoctet, voire plus)
  • ³Õ²¹°ù¾±¨¦³Ù¨¦?: diversit¨¦ des types de donn¨¦es (structur¨¦es et non structur¨¦es) qui circulent depuis de nombreuses sources diff¨¦rentes
  • Vitesse?: rapidit¨¦ ¨¤ laquelle les nouvelles donn¨¦es parviennent jusqu¡¯¨¤ votre syst¨¨me

Certains experts des donn¨¦es ¨¦largissent cette d¨¦finition ¨¤ quatre ou cinq V, voire davantage. Les quatri¨¨me et cinqui¨¨me V sont les suivants?:

  • ³Õ¨¦°ù²¹³¦¾±³Ù¨¦?: qualit¨¦ des donn¨¦es en termes d¡¯exactitude, de pr¨¦cision et de fiabilit¨¦
  • Valeur?: valeur ajout¨¦e que procurent les donn¨¦es (qu¡¯apportent-elles ¨¤ votre entreprise??)

Et cette liste peut s¡¯allonger jusqu¡¯¨¤ . Quoi qu¡¯il en soit, les cinq ¨¦voqu¨¦s ci-dessus sont les plus couramment employ¨¦s dans la d¨¦finition du Big Data.

D¡¯autre part, il existe deux cat¨¦gories de Big Data, qui se distinguent par leur mode de traitement et par les questions et requ¨ºtes auxquelles ils permettent de r¨¦pondre.

  • Le traitement par lot est g¨¦n¨¦ralement appliqu¨¦ ¨¤ de grandes quantit¨¦s de donn¨¦es d¡¯historique stock¨¦es, afin d¡¯¨¦laborer des strat¨¦gies ¨¤ long terme ou de r¨¦pondre ¨¤ des questions importantes. Imaginez des quantit¨¦s consid¨¦rables de donn¨¦es soumises ¨¤ une analyse complexe et approfondie.
  • Le streaming de donn¨¦es consiste moins ¨¤ r¨¦pondre ¨¤ des questions qu¡¯¨¤ obtenir des informations en temps r¨¦el, pour r¨¦pondre ¨¤ des objectifs imm¨¦diats - par exemple, garantir la pr¨¦cision d¡¯un processus de fabrication. Il est g¨¦n¨¦ralement appliqu¨¦ ¨¤ de grandes quantit¨¦ de donn¨¦es qui transitent rapidement. Imaginez des quantit¨¦s consid¨¦rables de donn¨¦es ultra rapides, soumises ¨¤ des analyses moins complexes mais effectu¨¦es ¨¤ toute vitesse.

En savoir plus sur la diff¨¦rence entre le Big Data et les donn¨¦es classiques.

D¡¯o¨´ vient le Big Data??

La notion de Big Data d¨¦crit l¡¯ensemble des donn¨¦es non structur¨¦es collect¨¦es aujourd¡¯hui, et la mani¨¨re dont on en extrait des informations strat¨¦giques fines. Elles proviennent de diverses sources?:

  • l¡¯Internet des Objets, et les donn¨¦es ¨¦mises par des milliards de p¨¦riph¨¦riques et de capteurs
  • les journaux g¨¦n¨¦r¨¦s automatiquement, utilis¨¦s pour analyse
  • les logiciels, plateformes et applications d'entreprise
  • les personnes?: r¨¦seaux sociaux, transactions, clics en ligne, dossiers m¨¦dicaux, consommation de ressources naturelles, etc.
  • les recherches de la communaut¨¦ scientifique et d¡¯autres organisations.

Les types de Big Data?: structur¨¦ et non structur¨¦

En fonction de leur type, les donn¨¦es appellent diff¨¦rents modes de stockage. C¡¯est le cas pour les donn¨¦es structur¨¦es et non structur¨¦es, qui n¨¦cessitent des bases de donn¨¦es, des outils de traitement, des supports de stockage et des outils d¡¯analyse diff¨¦rents.

Les donn¨¦es structur¨¦es correspondent aux donn¨¦es classiques, qui s¡¯int¨¨grent parfaitement ¨¤ des tableaux. Il est souvent facile de les classifier et de les formater en valeurs standard?: prix, dates, p¨¦riodes, etc.

Les donn¨¦es non structur¨¦es sont des donn¨¦es modernes, qu¡¯il n¡¯est pas si simple d¡¯ins¨¦rer dans un tableau. De nos jours, le terme est souvent synonyme de Big Data. On estime qu¡¯elles constitueront 80?% des donn¨¦es dans les prochaines ann¨¦es. Toutes les donn¨¦es g¨¦n¨¦r¨¦es par les r¨¦seaux sociaux, l¡¯IdO, les cr¨¦ateurs de contenus, le mat¨¦riel de surveillance, etc., en font partie. Il peut s¡¯agir de texte, d¡¯images, de son ou de vid¨¦o. Ces donn¨¦es constituent le moteur des nouvelles g¨¦n¨¦rations de stockage, tel que le stockage de fichier et d¡¯objet rapide et unifi¨¦ FlashBlade?. Pour utiliser leurs donn¨¦es non structur¨¦es, les entreprises doivent pouvoir s¡¯appuyer sur une capacit¨¦ de stockage plus importante, une puissance de traitement sup¨¦rieure et une consolidation plus pouss¨¦e des nombreux types de donn¨¦es.

En savoir plus sur les donn¨¦es structur¨¦es et non structur¨¦es.

Quel est le cycle de vie du Big Data??

Les ¨¦tapes du cycle de vie du Big Data sont les suivantes (liste non exhaustive)?:

  1. Les donn¨¦es sont extraites et collect¨¦es. Elles peuvent provenir de diverses sources, notamment des syst¨¨mes de planification des ressources des entreprises, des capteurs d¡¯IdO, des logiciels de marketing ou des applications de point de vente, des donn¨¦es de streaming via des API, etc. Les r¨¦sultats obtenus sont variables, d¡¯o¨´ l¡¯importance de l¡¯¨¦tape suivante - l¡¯ingestion. Ainsi, les donn¨¦es de la bourse seront tr¨¨s diff¨¦rentes des donn¨¦es issues des journaux de syst¨¨mes internes.
  2. Les donn¨¦es sont ing¨¦r¨¦es. Des canaux ETL (extraction, transformation, chargement) les convertissent au format voulu. En effet, qu¡¯elles soient destin¨¦es ¨¤ une base de donn¨¦es SQL ou ¨¤ un outil de visualisation, elles doivent devenir lisibles. Ainsi, il arrive que le format des noms ne sont pas coh¨¦rent. ? ce stade, les donn¨¦es sont pr¨ºtes pour analyse.
  3. Les donn¨¦es sont charg¨¦es dans le syst¨¨me de stockage pour ¨ºtre trait¨¦es. Elles peuvent ¨ºtre stock¨¦es n¡¯importe o¨´, du data warehouse dans le cloud au syst¨¨me sur site. Cette op¨¦ration peut se faire selon diff¨¦rentes modalit¨¦s, selon que les donn¨¦es sont charg¨¦es en lot ou en streaming continu bas¨¦ sur des ¨¦v¨¦nements. (Il est ¨¤ noter que cette ¨¦tape peut intervenir avant la transformation, suivant les besoins de l¡¯entreprise.)

    En savoir plus?: Qu¡¯est-ce qu¡¯un data warehouse??

  4. Les donn¨¦es font l¡¯objet de requ¨ºtes et d¡¯analyses. Les outils de calcul, de traitement et de stockage modernes dans le cloud exercent une influence consid¨¦rable sur l¡¯¨¦volution du cycle de vie du Big Data. (Remarque?: Certains outils modernes, tels qu¡¯Amazon Redshift, peuvent outrepasser les processus ETL pour vous permettre de lancer vos requ¨ºtes plus rapidement.)?
  5. Les donn¨¦es sont archiv¨¦es. Qu¡¯elles soient conserv¨¦es ¨¤ long terme dans un stockage ¨¤ froid ou conserv¨¦es ??au chaud?? dans un syst¨¨me plus accessible, les donn¨¦es p¨¦rissables qui ont ¨¦t¨¦ utilis¨¦es sont archiv¨¦es. Lorsqu¡¯il n¡¯est plus besoin de conserver un acc¨¨s direct, le stockage ¨¤ froid constitue une m¨¦thode ¨¦conomique et compacte - en particulier lorsqu¡¯il faut satisfaire ¨¤ des exigences de conformit¨¦ ou alimenter un processus d¨¦cisionnel strat¨¦gique ¨¤ long terme. Il limite ¨¦galement de conserver plusieurs p¨¦taoctets de donn¨¦es inutilis¨¦es sur des serveurs contenant ¨¦galement des donn¨¦es ??chaudes??, ce qui a un impact sur les performances.

Comment les entreprises peuvent-elles exploiter le Big Data??

Les usages professionnels sont nombreux et prometteurs. La valeur du Big Data r¨¦side dans les innovations qu¡¯il peut aider ¨¤ d¨¦velopper. Parmi les objectifs et applications possibles, on peut citer?:

  • l¡¯utilisation d¡¯informations strat¨¦giques en temps r¨¦el, issues d¡¯analyses de streaming de donn¨¦es, pour d¨¦clencher des alertes et identifier des anomalies
  • l¡¯analytique pr¨¦dictive
  • la Business Intelligence
  • l¡¯apprentissage machine
  • l¡¯analyse des risques, afin de pr¨¦venir les fraudes et les violations et de r¨¦duire les risques de s¨¦curit¨¦
  • l¡¯intelligence artificielle, notamment les outils de reconnaissance d¡¯image, de traitement du langage naturel et de r¨¦seaux neuronaux
  • l¡¯am¨¦lioration de l¡¯exp¨¦rience utilisateur et des interactions avec les clients ¨¤ travers des moteurs de recommandation et des outils de support pr¨¦dictif
  • la r¨¦duction des co?ts et des probl¨¨mes d¡¯efficacit¨¦ des processus (internes, de fabrication, etc.)
  • l¡¯alimentation des strat¨¦gies de marketing et de communication, ¨¤ travers l¡¯analyse en temps r¨¦el de millions de points de donn¨¦es sur les r¨¦seaux sociaux, cr¨¦¨¦s par les consommateurs ou la publicit¨¦ num¨¦rique

D¨¦couvrir davantage de sc¨¦narios d¡¯utilisation et d¡¯applications du Big Data propres aux diff¨¦rents secteurs.

Comment le Big Data est-il stock¨¦??

Le Big Data entra?ne des besoins uniques, notamment en termes de stockage. Il est presque syst¨¦matiquement int¨¦gr¨¦ ¨¤ une base de donn¨¦es (comme les donn¨¦es de streaming en temps r¨¦el), et comporte souvent une grande vari¨¦t¨¦ de formats. Il s¡¯ensuit que la meilleure option de stockage est souvent un environnement sans sch¨¦ma (non structur¨¦), ex¨¦cut¨¦ sur un syst¨¨me de fichiers distribu¨¦ afin que le traitement puisse se faire en parall¨¨le sur des ensembles de donn¨¦es consid¨¦rables. Le Big Data est donc particuli¨¨rement adapt¨¦ aux plateformes de stockage non structur¨¦ capables d¡¯unifier les donn¨¦es en mode fichier et objet.

En savoir plus sur la diff¨¦rence entre un hub de donn¨¦es et un data lake.

L¡¯informatique ¨¤ la p¨¦riph¨¦rie fait exploser la demande en Big Data

L¡¯essor de l¡¯Internet des Objets (IdO) a entra?n¨¦ une augmentation du volume de donn¨¦es ¨¤ g¨¦rer sur toute une flotte de p¨¦riph¨¦riques non distribu¨¦s.?

Au lieu d¡¯attendre que les donn¨¦es d¡¯IdO soient transf¨¦r¨¦es et trait¨¦es ¨¤ distance sur un site centralis¨¦, par exemple un datacenter, l¡¯informatique ¨¤ la p¨¦riph¨¦rie est une topologie distribu¨¦e dans laquelle les informations sont trait¨¦es localement, soit au point de contact entre les personnes et les appareils, l¨¤ o¨´ les nouvelles donn¨¦es sont cr¨¦¨¦es.?

En plus de g¨¦n¨¦rer des ¨¦conomies d¡¯argent et de bande passante, l¡¯informatique ¨¤ la p¨¦riph¨¦rie permet aux entreprises de d¨¦velopper des applications plus efficaces, en temps r¨¦el, qui offrent une exp¨¦rience utilisateur de grande qualit¨¦ ¨¤ leurs clients. Cette tendance est appel¨¦e ¨¤ s¡¯accentuer dans les ann¨¦es qui viennent, avec le d¨¦ploiement de nouvelles technologies sans fil, par exemple la 5G.

?tant donn¨¦ le nombre croissant d¡¯appareils connect¨¦s ¨¤ Internet, le volume de donn¨¦es ¨¤ traiter en temps r¨¦el et ¨¤ la p¨¦riph¨¦rie ne fera qu¡¯augmenter. Dans ces circonstances, comment proposer un stockage suffisamment distribu¨¦ et agile pour r¨¦pondre ¨¤ la demande?? La r¨¦ponse tient en quelques mots?: le stockage natif dans des conteneurs.?

Les plateformes d¡¯informatique ¨¤ la p¨¦riph¨¦rie qui existent aujourd¡¯hui, telles qu¡¯AWS Snowball, Microsoft Azure Stack, ou Google Anthos, sont toutes bas¨¦es sur Kubernetes, une plateforme d¡¯orchestration en conteneur tr¨¨s appr¨¦ci¨¦e. Gr?ce ¨¤ Kubernetes, ces environnements sont capables d¡¯ex¨¦cuter des charges de travail d¡¯ingestion de donn¨¦es, de stockage, de traitement, d¡¯analyse et d¡¯apprentissage automatique ¨¤ la p¨¦riph¨¦rie.?

Un cluster Kubernetes multi-n?ud ex¨¦cut¨¦ en p¨¦riph¨¦rie a besoin d¡¯un efficace, capable de r¨¦pondre aux besoins de charges de travail centr¨¦es sur les donn¨¦es. En d¡¯autres termes, les applications conteneuris¨¦es ex¨¦cut¨¦es ¨¤ la p¨¦riph¨¦rie n¨¦cessitent une gestion du stockage granulaire. La plateforme de services de donn¨¦es Portworx? propose une structure ??stateful?? permettant de g¨¦rer des volumes de donn¨¦es compatibles avec les SLA des conteneurs.

En savoir plus sur la relation entre le Big Data et l¡¯IdO.

Un stockage de donn¨¦es 100% flash ¨¦volutif pour r¨¦pondre ¨¤ tous vos besoins de Big Data

Les avantages d¡¯h¨¦berger le Big Data sur des baies 100?% flash sont les suivants?:

  • Vitesses am¨¦lior¨¦es (55-180?IOPS pour des disques durs contre 3?000-40?000?IOPS avec des SSD)
  • Parall¨¦lisme ¨¦lev¨¦ avec plus de 64?K de files d¡¯attente pour les op¨¦rations E/S
  • Performance et fiabilit¨¦ NVMe

Pourquoi choisir É«¿Ø´«Ã½? pour vos besoins de Big Data??

Le volume relatif, la vari¨¦t¨¦ et la vitesse du Big Data ne cessent d¡¯¨¦voluer. Si vous tenez ¨¤ pr¨¦server le volume et la rapidit¨¦ de vos donn¨¦es, vous devez investir r¨¦guli¨¨rement dans les technologies de stockage dernier cri. Au vu des avanc¨¦es r¨¦alis¨¦es dans le domaine des m¨¦moires flash, il est devenu possible de produire des solutions de stockage 100?% flash personnalis¨¦es, parfaitement adapt¨¦es ¨¤ tous vos niveaux de donn¨¦es. D¨¦couvrez ici comment É«¿Ø´«Ã½? peut vous aider ¨¤ optimiser votre pipeline d¡¯analyse du Big Data?:

  • Tous les avantages des baies 100?% flash
  • Consolidation dans un data hub unifi¨¦ et performant, capable de traiter les flux de donn¨¦es ¨¤ haut d¨¦bit provenant de diverses sources
  • Mises ¨¤ niveau sans interruption, temps d¡¯arr¨ºt ni migration de donn¨¦es dans le cadre du programme Evergreen?
  • Syst¨¨me de gestion des donn¨¦es simplifi¨¦ qui combine l¡¯avantage ¨¦conomique du cloud au contr?le et ¨¤ l¡¯efficacit¨¦ sur site

Stockage flash ¨¦volutif rapide et efficace avec FlashBlade

Nous vous recommandons ¨¦galement¡­

11/2024
Enhance Data Lakehouse Infrastructure
É«¿Ø´«Ã½? has partnered with Dremio, the unified data lakehouse platform, to help enterprises build a future-proof, scalable, and efficient data infrastructure.
±Ê°ù¨¦²õ±ð²Ô³Ù²¹³Ù¾±´Ç²Ô
3 pages

Parcourez les ressources cl¨¦s et les ¨¦v¨¦nements

LEADERSHIP ?CLAIR?
La course ¨¤ l¡¯innovation

Les derni¨¨res informations strat¨¦giques et perspectives fournies par des leaders du secteur, pionniers de l¡¯innovation en mati¨¨re de stockage.

En savoir plus
RAPPORT D¡¯ANALYSTE
Pr¨¦parer votre cyber-r¨¦silience future

D¨¦couvrez des strat¨¦gies de collaboration qui vous aideront ¨¤ tirer le meilleur parti de vos investissements dans la cybers¨¦curit¨¦ et ¨¤ garantir une r¨¦action et une r¨¦cup¨¦ration rapides.

Lire le rapport
RESSOURCE
L¡¯avenir du stockage?: les nouvelles r¨¨gles de l¡¯¨¨re de l¡¯IA

D¨¦couvrez comment les nouveaux d¨¦fis comme l¡¯IA transforment les besoins de stockage des donn¨¦es et n¨¦cessitent de repenser les processus et d¡¯adopter une approche moderne pour r¨¦ussir.

Obtenir l¡¯e-book
RESSOURCE
D¨¦laisser l¡¯achat de stockage pour favoriser l¡¯adoption de plateformes

D¨¦couvrez les besoins, les composants et le processus de s¨¦lection des plateformes de stockage d¡¯entreprise.

Lire le rapport
CONTACTEZ-NOUS
Des questions, des commentaires??

Vous avez des questions ou des commentaires concernant des produits ou certifications?Pure??? Nous sommes l¨¤ pour vous aider.

Planifier une d¨¦mo

Planifiez une d¨¦mo en direct et d¨¦couvrez comment Pure peut vous aider ¨¤ transformer vos donn¨¦es.?

°Õ¨¦±ô.?:?+33 1 89 96 04 00

Services M¨¦dias?:?pr@purestorage.com

?

É«¿Ø´«Ã½ France

32 rue Guersant

75017 Paris

info@purestorage.com

?

FERMER
Votre navigateur n¡¯est plus pris en charge !

Les anciens navigateurs pr¨¦sentent souvent des risques de s¨¦curit¨¦. Pour profiter de la meilleure exp¨¦rience possible sur notre site, passez ¨¤ la derni¨¨re version de l¡¯un des navigateurs suivants.