C¨®mo funciona el almacenamiento de datos
La log¨ªstica de la recopilaci¨®n de datos de distintas partes de la empresa para obtener informaci¨®n ¨²til puede escalar en complejidad a medida que su empresa crece. El almacenamiento de datos le puede ofrecer a su empresa una forma confiable para consolidar esa informaci¨®n en una ¨²nica base de datos y modelo de datos que les permita? a los analistas ejecutar las consultas.?
Funciona de la siguiente manera:
- Extraer: recopila datos sin procesar desde las fuentes dispares en la organizaci¨®n (p.?ej., ERP, CRM, ventas, marketing) en bases de datos de almacenamiento provisional.
- Transformar: los datos en la capa de almacenamiento provisional se transfieren a una capa de integraci¨®n, en la que los datos se combinan y transforman en el almac¨¦n operacional de los datos (ODS, Operational Data Store).
- Cargar: los datos se trasladan desde la capa de integraci¨®n hasta el almacenamiento de datos al definir el esquema que los analistas desean utilizar para las consultas SQL antes de escribirlas en la base de datos relacional (esquema contra escritura).?
La base de datos con la que interact¨²a en un almacenamiento de datos es relacional, esto significa que los datos est¨¢n estructurados (almacenados en tablas con columnas y filas). Estas tablas se organizan seg¨²n el esquema definido? durante la escritura.?
Cuando un ODS externo al almacenamiento de datos controla el paso de transformaci¨®n, se lo denomina proceso de extraer, transformar y cargar (ETL, Extract, Transform, Load). Cuando el almacenamiento de datos controla las transformaciones a nivel interno, se lo denomina proceso de extraer, cargar y transformar (ELT, Extract, Load, Transform). Ya sea que utilice el proceso de ETL o de ELT, el almacenamiento de datos necesita datos estructurados y un esquema contra escritura para trabajar con bases de datos relacionales.
?Para qu¨¦ se utiliza el almacenamiento de datos?
Las aplicaciones frecuentes en el almacenamiento de datos incluyen:
- Procesamiento de transacciones en l¨ªnea (OLTP, Online Transaction Processing): puede optimizar el almacenamiento de datos para que la integridad de los datos y las consultas r¨¢pidas controlen un gran volumen de transacciones de datos breves. Por ejemplo, las transacciones que se producen en una plataforma de negociaci¨®n de alta frecuencia.?
- Procesamiento anal¨ªtico en l¨ªnea (OLAP, Online Analytical Processing): puede optimizar el almacenamiento de datos para consultas m¨¢s complejas y r¨¢pidas en el caso de las transacciones de volumen relativamente menor. Esto es lo que un analista suele utilizar para generar los informes de BI.
- An¨¢lisis predictivo: Puede optimizar un sistema OLAP para predecir eventos futuros y generar situaciones hipot¨¦ticas para su empresa, a menudo con la ayuda de los algoritmos de aprendizaje autom¨¢tico.
Debido a que el almacenamiento de datos es un esquema contra escritura, es importante conocer el tipo de consulta que desea realizar antes de agregar el esquema al almacenamiento de datos. Con el fin de administrar la complejidad de las fuentes de datos dispares, puede segmentar el almacenamiento de datos en mercados de datos y dedicar los recursos de hardware y software para funciones espec¨ªficas de la empresa como las relaciones con los clientes (CRM, Customer Relationship Management).
Almacenamiento de datos vs. data lake vs. hub de datos
A pesar de que estos tres conceptos suenan equivalentes, es importante comprender sus diferencias:
- Almacenamiento de datos: un ¨²nico repositorio para la integraci¨®n y el almacenamiento de datos estructurados obtenidos de varias fuentes de datos sin estructurar en la organizaci¨®n.
- Data lake: un ¨²nico repositorio unificado para todas las fuentes de datos sin procesar, estructurados y sin estructura en una organizaci¨®n (que incluye el almacenamiento de datos). Los datos se deben procesar de todas formas para extraer los resultados de BI.?
- Hub de datos: una ¨²nica interfaz que consolida todos los datos, estructurados y sin estructura, en una capa central de datos accesibles. La diferencia con el almacenamiento de datos es que tambi¨¦n puede controlar datos operativos y la diferencia con data lake es que posee la capacidad de presentar datos en varios formatos.?
Los hubs de datos proporcionan la regulaci¨®n de datos necesaria para optimizar el uso compartido de datos entre una diversa colecci¨®n de puntos de conexi¨®n. De esta manera, los hubs de datos consolidan los data lakes y el almacenamiento de datos en una ¨²nica capa de acceso. El procesamiento de datos se abstrae detr¨¢s del hub de datos, lo que le otorga a su organizaci¨®n un lugar centralizado para extraer los resultados de BI.
?Por qu¨¦ conviene elegir É«¿Ø´«Ã½ para satisfacer con sus necesidades de almacenamiento de datos?
Si necesita agregar un nuevo proceso de OLAP u OLTP a la infraestructura actual del almacenamiento de datos, se recomienda considerar la posibilidad de realizar una inversi¨®n en Modern Data Experience? con las soluciones de almacenamiento basado ¨ªntegramente en tecnolog¨ªa flash de É«¿Ø´«Ã½.?
Como el primer hub de datos de la industria, É«¿Ø´«Ã½? ?FlashBlade?? controla las cargas de trabajo de los informes y las t¨¦cnicas de an¨¢lisis del almacenamiento de datos y tambi¨¦n ofrece las cualidades b¨¢sicas para el hub de datos:
- Uso compartido de datos sin problemas en todos los puntos de conexi¨®n de datos.
- Almacenamiento de objetos y archivos unificados.
- La capacidad de controlar los datos operativos en tiempo real.
- Cuenta con una arquitectura nativa para la escalabilidad horizontal.
- Su dise?o brinda rendimiento multidimensional para datos de cualquier tipo.
- Paralelismo masivo de software a hardware.