Data Lake ou Data Hub
La conception d¡¯un Data Hub diff¨¨re grandement de celle d¡¯un Data Lake. Le Data Lake est con?u pour stocker des donn¨¦es de mani¨¨re aussi efficace que possible et s¡¯appuie sur des technologies traditionnelles telles que le stockage DAS. Le principal probl¨¨me du Data Lake est qu¡¯il cr¨¦e des silos de donn¨¦es, ce qui emp¨ºche de combiner les jeux de donn¨¦es en un ensemble coh¨¦rent et adapt¨¦ aux besoins de l¡¯analytique.
Un ?Data Hub? est une architecture de stockage moderne, centr¨¦e sur les donn¨¦es, qui ?alimente l'analytique et l'IA?. Il permet ainsi aux entreprises de consolider et de partager leurs donn¨¦es. Contrairement aux Data Lakes et aux architectures DAS, con?ues pour stocker des donn¨¦es, un Data Hub est pens¨¦ pour les partager et les mettre ¨¤ disposition en temps r¨¦el en assurant des performances multidimensionnelles.
Pourquoi les Data Lakes sont-ils en train de dispara?tre??
Si les Data Lakes sont aujourd¡¯hui d¨¦pass¨¦s, c¡¯est aussi parce qu¡¯ils reposent sur un principe obsol¨¨te selon lequel toutes les donn¨¦es non structur¨¦es doivent ¨ºtre stock¨¦es. Certaines donn¨¦es sont stock¨¦es dans des entrep?ts de donn¨¦es, d¡¯autres sont perdues dans les Data Lakes. Les donn¨¦es n¡¯¨¦tant plus unifi¨¦es, la vitesse d¡¯exploitation des donn¨¦es en est directement affect¨¦e. Pourquoi est-il si difficile pour les syst¨¨mes de stockage traditionnels d¡¯unifier les donn¨¦es sur une m¨ºme plateforme?? Chaque application pose diff¨¦rentes exigences en termes de donn¨¦es, d¡¯o¨´ la prolif¨¦ration des silos. Le moment est venu de red¨¦finir le stockage des donn¨¦es.
Les donn¨¦es sont la source d'¨¦nergie des entreprises modernes. Pourtant, la plupart des donn¨¦es sont stock¨¦es en silos, fragment¨¦es et hors de port¨¦e des applications d¡¯analytique et d¡¯IA (Intelligence Artificielle). L¡¯intelligence moderne requiert une architecture destin¨¦e non seulement ¨¤ stocker les donn¨¦es, mais aussi ¨¤ les partager et ¨¤ les exploiter.
?
