O Big Data fornece às empresas imensas oportunidades, incluindo insights mais significativos sobre o comportamento do cliente, previs?es mais precisas sobre a atividade do mercado e eficiência geral aprimorada.
As pessoas e as empresas est?o gerando cada vez mais dados todos os anos. De acordo com um relatório da IDC, o mundo criou apenas 1,2 zettabytes (1,2 trilh?es de gigabytes) de novos dados em 2010. Até 2025, esse número aumentará para 175 zettabytes (175 trilh?es de gigabytes) ou mais1.
? medida que as empresas exploram esse próspero recurso por meio de análise preditiva e minera??o de dados, o mercado do Big Data também cresce. A prevê que o mercado do Big Data duplicará entre 2018 e 2027, passando de US$ 169 bilh?es para US$ 274 bilh?es.
Mas quais s?o as principais diferen?as entre Big Data e os dados tradicionais? E quais implica??es eles têm sobre a tecnologia atual de processamento, análise e armazenamento de dados? Aqui, explicaremos as diferentes finalidades de cada tipo de dado, bem como enfatizaremos a import?ncia de uma estratégia que é planejada para o sucesso, tanto com o Big Data quanto com os dados tradicionais.
?
O que s?o dados tradicionais?
Os dados tradicionais s?o estruturados, dados relacionais que as organiza??es vêm armazenando e processando há décadas. Os dados tradicionais ainda representam a maior parte dos dados do mundo todo.
As empresas podem usar esses dados tradicionais para acompanhar vendas, ou gerenciar fluxos de trabalho ou rela??es com os clientes. Normalmente, os dados tradicionais s?o mais fáceis de manipular e podem ser gerenciados com software convencional de processamento de dados. No entanto, geralmente eles fornecem insights menos sofisticados e benefícios mais limitados do que o Big Data.
?
O que é Big Data?
O Big Data pode se referir a um conjunto de dados grande e complexo, bem como aos métodos usados para processar esse tipo de dado. O Big Data tem quatro características principais, muitas vezes conhecidas como “os quatro Vs”:
- Volume: o Big Data é… grande. Embora o Big Data n?o seja diferenciado apenas pelo seu tamanho, geralmente seu volume é bem grande por natureza.
- Variedade: um conjunto de Big Data normalmente contém dados estruturados, semiestruturados e n?o estruturados.
- Velocidade: o Big Data é gerado rapidamente e muitas vezes processado em tempo real.
- Veracidade: a qualidade do Big Data n?o é inerentemente melhor do que a dos dados tradicionais, mas sua veracidade (precis?o) é extremamente importante. Anomalias, desvios e ruídos podem afetar consideravelmente a qualidade do Big Data.
?
As diferen?as entre o Big Data e os dados tradicionais
Várias características s?o usadas para diferenciar o Big Data dos dados tradicionais. Entre elas:
- O tamanho dos dados
- Como os dados s?o organizados
- A arquitetura necessária para gerenciar os dados
- As fontes de onde derivam os dados
- Os métodos usados para analisar os dados
Tamanho
Os conjuntos de dados tradicionais tendem a ser medidos em gigabytes e terabytes. Consequentemente, o tamanho deles pode permitir o armazenamento centralizado, mesmo em um servidor.
O Big Data é diferenciado n?o somente pelo seu tamanho, mas também pelo seu volume. O Big Data normalmente é medido em petabytes, zettabytes ou exabytes. O tamanho cada vez maior dos conjuntos de Big Data é um dos principais propulsores por trás da demanda por solu??es mais modernas de armazenamento de dados, baseadas em nuvem e de alta capacidade.
Organiza??o
Os dados tradicionais normalmente s?o dados estruturados que s?o organizados em registros, arquivos e tabelas. Os campos nos conjuntos de dados tradicionais s?o relacionais, de modo que é possível trabalhar as respectivas rela??es e manipular os dados adequadamente. Os bancos de dados tradicionais, como SQL, Oracle DB e MySQL, usam um esquema fixo que é estático e pré-configurado.
O Big Data usa um esquema din?mico. No armazenamento, o Big Data é bruto e n?o estruturado. Quando o Big Data é acessado, o esquema din?mico é aplicado aos dados brutos. Os bancos de dados modernos n?o relacionais ou NoSQL, como Cassandra e MongoDB, s?o perfeitos para dados n?o estruturados, devido ao modo como os dados s?o armazenados nos arquivos.
Arquitetura
Os dados tradicionais geralmente s?o gerenciados por meio de uma arquitetura centralizada, que pode ser mais econ?mica e mais segura para conjuntos de dados menores e estruturados.
De modo geral, um sistema centralizado consiste em um ou mais nós de cliente (por exemplo, computadores ou dispositivos móveis) conectados a um nó central (por ex.: um servidor). O servidor central controla a rede e monitora sua seguran?a.
Devido à escala e complexidade, n?o é possível gerenciar o Big Data centralmente. Ele exige uma arquitetura distribuída.
Os sistemas distribuídos vinculam vários servidores ou computadores por uma rede, operando como nós coiguais. A arquitetura pode ser expandida horizontalmente e continuará funcionando mesmo se um nó individual falhar. Os sistemas distribuídos podem aproveitar o hardware padr?o para reduzir custos.
Origens
Normalmente, os dados tradicionais s?o derivados do planejamento de recursos corporativos (ERP, Enterprise Resource Planning), do gerenciamento de relacionamento com o cliente (CRM, Customer Relationship Management), de transa??es online e outros dados de nível empresarial.
O Big Data deriva de uma variedade maior de dados de nível empresarial e n?o empresarial, que podem incluir informa??es retiradas de mídias sociais, dados de dispositivos e sensores, além de dados audiovisuais. Esses tipos de fonte s?o din?micos, evolutivos e est?o aumentando a cada dia.
As fontes de dados n?o estruturados também podem incluir arquivos de áudio, imagem e vídeo. Aproveitar esse tipo de dado n?o é possível usando as colunas e linhas dos bancos de dados tradicionais. Devido a uma quantidade cada vez mais significativa de dados n?o estruturados provenientes de várias fontes, os métodos da análise de Big Data s?o obrigatórios para extrair valor deles.
础苍á濒颈蝉别
A análise de dados tradicionais ocorre de modo incremental: um evento ocorre, os dados s?o gerados e a análise desses dados ocorre depois do evento. A análise de dados tradicionais pode ajudar as empresas a entender os impactos de determinadas estratégias ou altera??es em um intervalo limitado de métricas por um período específico.
A análise de Big Data pode ocorrer em tempo real. Como o Big Data é gerado segundo a segundo, a análise pode ocorrer enquanto os dados estiverem sendo coletados. A análise de Big Data oferece às empresas um entendimento mais din?mico e holístico das necessidades e estratégias.
Por exemplo, suponha que uma empresa tenha investido em um programa de treinamento para sua equipe e queira avaliar seu impacto.
Com um modelo tradicional de análise de dados, a empresa pretende determinar o impacto do programa de treinamento em uma área específica de suas opera??es, como vendas. A empresa anota o volume de vendas antes e depois do treinamento e exclui todos os fatores irrelevantes. Ela pode, na teoria, ver o quanto as vendas aumentaram em consequência do treinamento.
Com um modelo de análise de big data, a empresa pode separar as quest?es relacionadas a como o programa de treinamento afetou qualquer aspecto específico de suas opera??es. Ao analisar uma enorme quantidade de dados coletados em tempo real em toda a empresa, é possível identificar as áreas específicas que foram afetadas, como vendas, servi?o de atendimento ao consumidor, rela??es públicas, etc.
?
Big Data x dados tradicionais: considera??es importantes para o futuro
O Big Data e os dados tradicionais têm finalidades diferentes, mas relacionadas. Embora possa parecer que o Big Data tenha benefícios potencialmente melhores, ele n?o é adequado (ou necessário) em todas as circunst?ncias. O Big Data:
- Pode fornecer uma análise mais detalhada das tendências do mercado e do comportamento do consumidor. A análise dos dados tradicionais pode ser mais limitada e bastante restrita para fornecer os insights significativos que o Big Data pode fornecer.
- Fornece insights com mais rapidez. As organiza??es podem aprender com o Big Data em tempo real. No contexto da análise de Big Data, essa pode ser uma vantagem competitiva.
- ? mais eficiente. A natureza cada vez mais digital da nossa sociedade significa que as pessoas e empresas est?o gerando gigantescas quantidades de dados todos os dias – até mesmo a cada minuto. O Big Data nos permite explorar esses dados e interpretá-los de maneira significativa.
- Exige prepara??o avan?ada. Para aproveitar esses benefícios, as organiza??es precisam se preparar para o Big Data por meio de novos protocolos de seguran?a, etapas de configura??o e aumentos na potência de processamento disponível.
A ascens?o do Big Data n?o significa que os dados tradicionais est?o saindo de cena. Os dados tradicionais:
- Podem ser mais fáceis de proteger, o que os tornam preferíveis para conjuntos de dados altamente confidenciais ou pessoais. Como os dados tradicionais s?o menores, eles n?o exigem arquitetura distribuída e é menos provável que exijam armazenamento de terceiros.
- Podem ser processados usando software convencional de processamento de dados e uma configura??o comum de sistema. O processamento de Big Data normalmente requer uma instala??o de configura??o mais alta, o que pode aumentar o uso e o custo de recursos desnecessariamente, quando os métodos de dados tradicionais d?o conta do recado.
- S?o fáceis de manipular e interpretar. Como os dados tradicionais s?o mais simples e relacionais por natureza, eles podem ser processados usando fun??es comuns, podendo até ser acessíveis a pessoas inexperientes.
Por fim, n?o se trata de escolher entre o Big Data e os dados tradicionais. ? medida que mais e mais empresas geram grandes conjuntos de dados n?o estruturados, elas precisam das ferramentas certas para manipulá-los. Entender como usar e dar suporte a ambos os modelos é uma parte necessária da atualiza??o da estratégia para estar pronto para um Big Data futuro.
?
- Dados estruturados x dados n?o estruturados
- Cinco maneiras de atingir o sucesso com a ajuda do Big Data
- A rela??o entre o Big Data e a IoT