Le Big Data offre des opportunit¨¦s colossales aux entreprises?: des informations plus pertinentes sur les comportements des clients, des pr¨¦visions plus pr¨¦cises de l¡¯activit¨¦ du march¨¦ et une meilleure efficacit¨¦ globale.
Chaque ann¨¦e, les personnes et les organisations g¨¦n¨¨rent un nombre croissant de donn¨¦es. D¡¯apr¨¨s un rapport IDC, 1,2 zettaoctets de donn¨¦es (soit 1,2 trillions de gigaoctets) ont ¨¦t¨¦ cr¨¦¨¦es en 2010. D¡¯ici 2025, ce chiffre pourrait atteindre 175 zettaoctets (175 trillions de gigaoctets), voire davantage1.
? mesure que les entreprises exploitent cette ressource florissante via de outils d¡¯analyse pr¨¦dictive et d¡¯exploration des donn¨¦es, le march¨¦ du Big Data s¡¯¨¦toffera. Une pr¨¦voit que la valeur de ce march¨¦ sera multipli¨¦e par deux entre 2018 et 2027, passant de 169?milliards de dollars ¨¤ 274 milliards de dollars.
Mais quelles sont les principales diff¨¦rences entre le Big Data et les donn¨¦es classiques?? Et quelles en sont les cons¨¦quences pour les technologies de stockage, de traitement et d¡¯analyse actuelles?? Nous allons pr¨¦senter les utilisations des diff¨¦rents types de donn¨¦es, en insistant sur l¡¯int¨¦r¨ºt d¡¯une strat¨¦gie de r¨¦ussite bas¨¦e ¨¤ la fois sur le Big Data et les donn¨¦es classiques.
?
Que sont les donn¨¦es classiques??
Les donn¨¦es classiques correspondent aux donn¨¦es structur¨¦es et relationnelles que les entreprises stockent et traitent depuis des dizaines d¡¯ann¨¦es. Actuellement, elles repr¨¦sentent encore la majorit¨¦ des donn¨¦es dans le monde.
Les entreprises peuvent utiliser ces donn¨¦es classiques pour assurer un suivi de leurs ventes ou g¨¦rer leurs relations clients et leurs flux m¨¦tier. Elles sont souvent plus faciles ¨¤ manipuler et peuvent ¨ºtre g¨¦r¨¦es ¨¤ l¡¯aide de logiciels de traitement conventionnels. Cela dit, elles fournissent g¨¦n¨¦ralement des informations moins sophistiqu¨¦es et offrent des avantages plus restreints que le Big Data.
?
Qu¡¯est-ce que le Big Data??
La notion de Big Data d¨¦signe ¨¤ la fois un ensemble consid¨¦rable et complexe de donn¨¦es, et les m¨¦thodes utilis¨¦es pour les traiter. Le Big Data pr¨¦sente quatre caract¨¦ristiques principales, souvent appel¨¦es ??les 4 V???:
- Volume?: Le Big Data, comme son nom l¡¯indique, est volumineux. Ce n¡¯est pas sa seule caract¨¦ristique, mais c¡¯est un ¨¦l¨¦ment constitutif.
- ³Õ²¹°ù¾±¨¦³Ù¨¦?: Un ensemble de Big Data contient g¨¦n¨¦ralement des donn¨¦es structur¨¦es, semi-structur¨¦es et non structur¨¦es.
- Vitesse?: Le Big Data est g¨¦n¨¦r¨¦ rapidement, et souvent trait¨¦ en temps r¨¦el.
- ³Õ¨¦°ù²¹³¦¾±³Ù¨¦?: Le Big Data n¡¯est pas fondamentalement de meilleure qualit¨¦ que les donn¨¦es classique, mais il est extr¨ºmement pr¨¦cis. Les anomalies, les biais et les bruits peuvent affecter consid¨¦rablement sa qualit¨¦.
?
Diff¨¦rences entre le Big Data et les donn¨¦es classiques
Pour distinguer le Big Data des donn¨¦es classiques, on s¡¯appuie sur plusieurs caract¨¦ristiques, notamment?:
- le volume de donn¨¦es
- la mani¨¨re dont elles sont organis¨¦es
- l¡¯architecture requise pour les g¨¦rer
- les sources dont elles proviennent
- les m¨¦thodes utilis¨¦es pour les analyser.
Volume
Les volumes de donn¨¦es classiques sont g¨¦n¨¦ralement mesur¨¦s en gigaoctets, voire en t¨¦raoctets. Elles peuvent donc ¨ºtre rassembl¨¦es dans un stockage centralis¨¦e, parfois m¨ºme sur un seul serveur.
Pour le Big Data, en revanche, les notions de quantit¨¦ et de volume sont d¨¦finitoires. On le mesure g¨¦n¨¦ralement en p¨¦taoctets, en zettaoctets ou en exaoctets. Le volume de plus en plus cons¨¦quent des ensembles de Big Data est l¡¯un des principaux facteurs expliquant la croissance de la demande en solutions de stockage haute capacit¨¦ bas¨¦es sur le cloud.
Organisation
Les donn¨¦es classiques, structur¨¦es, sont organis¨¦es sous forme de dossiers, de fichiers et de tableaux. Les champs des ensembles de telles donn¨¦es sont relationnels, de sorte qu¡¯il est possible d¡¯identifier des liens entre elles et de les g¨¦rer en fonction de ces ¨¦l¨¦ments. Les bases de donn¨¦es classiques, telles que SQL, Oracle DB et MySQL, utilisent un sch¨¦ma fixe, statique et pr¨¦configur¨¦.
Le Big Data, quant ¨¤ lui, utilise un sch¨¦ma dynamique. Les donn¨¦es contenues dans le syst¨¨me de stockage sont brutes et non structur¨¦es. Pour acc¨¦der au Big Data, ce sch¨¦ma dynamique est appliqu¨¦ aux donn¨¦es brutes. Des bases de donn¨¦es modernes, non relationnelles ou NoSQL, comme Cassandra et MongoDB, conviennent parfaitement aux donn¨¦es non structur¨¦es en raison de leur mani¨¨re de stocker les donn¨¦es dans les fichiers.
Architecture
Les donn¨¦es classiques sont g¨¦n¨¦ralement g¨¦r¨¦es via une architecture centralis¨¦e, qui peut se r¨¦v¨¦ler plus abordable et plus s?re pour des ensembles de donn¨¦es structur¨¦es plus restreints.
G¨¦n¨¦ralement, un syst¨¨me centralis¨¦ est constitu¨¦ d¡¯un ou plusieurs n?uds clients (ordinateurs ou appareils mobiles, par exemple) reli¨¦s ¨¤ un n?ud central (p.?ex. un serveur). Ce serveur central contr?le le r¨¦seau et garantit sa s¨¦curit¨¦.
En raison de son volume et de sa complexit¨¦, il n¡¯est pas possible de g¨¦rer le Big Data de mani¨¨re centralis¨¦e. Il n¨¦cessite une architecture distribu¨¦e.
Les syst¨¨mes distribu¨¦s associent plusieurs serveurs ou ordinateurs au sein d¡¯un r¨¦seau, tous ¨¦tant trait¨¦s comme des n?uds de m¨ºme niveau. Ils peuvent s¡¯¨¦tendre de mani¨¨re horizontale (??scale-out??) et continuent de fonctionner en cas de d¨¦faillance de l¡¯un des n?uds. Il est possible d¡¯utiliser du mat¨¦riel de commodit¨¦ afin de limiter les co?ts.
Sources
G¨¦n¨¦ralement, les donn¨¦es classiques proviennent de logiciels de planification des ressources d¡¯entreprise (ERP), de gestion des relations client (CRM), ou encore de transactions en ligne et autres sources au niveau de l¡¯entreprise.
Le Big Data, lui, provient d¡¯une plus grande vari¨¦t¨¦ de sources, dans l¡¯entreprise et en dehors, notamment des informations issues des r¨¦seaux sociaux, g¨¦n¨¦r¨¦es par des appareils ou des capteurs, ou encore des donn¨¦es audiovisuelles. Ces sources sont dynamiques, ¨¦volutive, et se multiplient chaque jour.
Les fichiers texte, vid¨¦o, image et audio peuvent ¨¦galement constituer des sources de donn¨¦es non structur¨¦es. Elles ne peuvent pas ¨ºtre exploit¨¦es ¨¤ partir des colonnes et des lignes des bases de donn¨¦es classiques. Dans la mesure o¨´ la quantit¨¦ de donn¨¦es non structur¨¦es va croissant, de m¨ºme que le nombre de leurs sources, des m¨¦thodes d¡¯analyse du Big Data sont n¨¦cessaire pour en tirer toute la valeur ajout¨¦e.
Analyse
L¡¯analyse des donn¨¦es classiques se fait de mani¨¨re incr¨¦mentale. Un ¨¦v¨¦nement se produit, des donn¨¦es sont g¨¦n¨¦r¨¦es, puis elles sont analys¨¦es. Cette analyse peut permettre aux entreprises de comprendre les impacts de strat¨¦gies ou de changements donn¨¦s, sur un certain nombre de m¨¦triques, pour une p¨¦riode donn¨¦e.
L¡¯analyse du Big Data, elle, peut se faire en temps r¨¦el. Dans la mesure o¨´ ces donn¨¦es sont g¨¦n¨¦r¨¦es ¨¤ chaque seconde, la collecte et l¡¯analyse peuvent ¨ºtre simultan¨¦es. L¡¯analyse du Big Data donne aux entreprises une vision plus dynamique et globale de leurs besoins et de leurs strat¨¦gies.
Imaginons une entreprise qui a investi dans un programme de formation de son personnel, et souhaite en ¨¦valuer l¡¯impact.
Avec un mod¨¨le d¡¯analyse classique, elle pourra identifier cet impact sur un pan pr¨¦cis de ses op¨¦rations, par exemple les ventes. Pour cela, elle note le volume des ventes avant en apr¨¨s la formation, en excluant tout facteur ext¨¦rieur. Elle constatera ainsi, en th¨¦orie, le degr¨¦ d¡¯augmentation des ventes suite ¨¤ la formation.
Avec une analyse du Big Data, l¡¯entreprise peut mettre de c?t¨¦ la question de l¡¯incidence de cette formation sur un aspect donn¨¦ de ses activit¨¦s. En revanche, en observant la masse de donn¨¦es recueillies en temps r¨¦el dans l¡¯ensemble de l¡¯organisation, elle pourra identifier les domaines qui ont ¨¦t¨¦ touch¨¦s?: ventes, service client, relations publiques, etc.
?
Big Data vs. donn¨¦es classiques?: consid¨¦rations d¡¯avenir
Le Big Data et les donn¨¦es classiques servent des objectifs diff¨¦rents, mais connexes. Si le Big Data peut sembler pr¨¦senter un potentiel de b¨¦n¨¦fice plus important, il n¡¯est pas adapt¨¦ (ni n¨¦cessaire) ¨¤ toutes les circonstances. Le Big Data?:
- peut permettre d¡¯analyser plus finement les tendances du march¨¦ et le comportement des consommateurs. L¡¯analyse des donn¨¦es classiques peut se r¨¦v¨¦ler trop restreinte pour fournir les m¨ºmes informations strat¨¦giques.
- fournit plus rapidement des informations strat¨¦giques. Les entreprises en tirent un enseignement en temps r¨¦el. Gr?ce aux analyses du Big Data, elles peuvent ainsi gagner un avantage concurrentiel.
- sont plus efficaces. Dans une soci¨¦t¨¦ de plus en plus num¨¦rique, les personnes et les organisations g¨¦n¨¨rent des quantit¨¦s consid¨¦rables de donn¨¦es chaque jour, chaque minute. Le Big Data permet d¡¯en tirer parti et de les interpr¨¦ter de mani¨¨re pertinente.
- n¨¦cessite une bonne pr¨¦paration. Pour exploiter ces avantages, les entreprises doivent se pr¨¦parer, ¨¤ travers des protocoles de s¨¦curit¨¦, des ¨¦tapes de configuration, et une puissance de traitement disponibles sup¨¦rieure.
L¡¯essor du Big Data n¡¯implique pas la disparition des donn¨¦es classiques. Celles-ci?:
- sont plus faciles ¨¤ s¨¦curiser, et donc potentiellement mieux adapt¨¦es ¨¤ des ensembles de donn¨¦es hautement sensibles, ¨¤ caract¨¨re personnel ou confidentiel. En effet, elles sont moins volumineuses. Elles ne requi¨¨rent donc pas une architecture distribu¨¦e et sont moins susceptible de n¨¦cessiter un stockage tiers.
- peuvent ¨ºtre trait¨¦es par des logiciels traditionnels avec une configuration de syst¨¨me normale. Le traitement du Big Data n¨¦cessite une configuration plus avanc¨¦e, ce qui augmente l¡¯utilisation des ressources et les frais. Tout cela n¡¯est pas n¨¦cessaire lorsque des m¨¦thodes classiques suffisent.
- sont plus faciles ¨¤ manipuler et ¨¤ interpr¨¦ter. Les donn¨¦es classiques ¨¦tant par nature plus simples et relationnelles, elles peuvent ¨ºtre trait¨¦es ¨¤ l¡¯aide de fonctions normales, voire ¨ºtre accessibles ¨¤ des non-experts.
La question, tout bien consid¨¦r¨¦, n¡¯est pas de choisir entre le Big Data et les donn¨¦es classiques. ? mesure que les entreprises seront de plus en plus nombreuses ¨¤ g¨¦n¨¦rer de grands ensembles de donn¨¦es non structur¨¦es, elles auront besoin de mettre en place les bons outils. Comprendre comment utiliser et g¨¦rer les deux mod¨¨les fait partie int¨¦grante de l¡¯¨¦laboration d¡¯une strat¨¦gie d¡¯avenir.
?
- Donn¨¦es structur¨¦es vs. donn¨¦es non structur¨¦es
- 5?atouts du Big Data qui aident les entreprises ¨¤ distancer la concurrence
- La relation entre l¡¯IdO et le Big Data