色控传媒

Skip to Content
La guida ai Big Data starter pack

Dati strutturati e dati non strutturati a confronto

Nell'ultimo decennio, la nostra definizione e comprensione di cosa sono i dati è cambiata radicalmente, in parte a causa della crescente disponibilità di nuovi strumenti per leggere, archiviare e analizzare i dati non strutturati.

In passato, i dati non strutturati sono stati spesso sottoutilizzati, data la difficoltà di interpretarli. Le nuove tecnologie hanno reso più facile non solo comprendere i dati non strutturati, ma anche estrarre preziose indicazioni da questa miniera di informazioni.

, il volume totale di dati creati, acquisiti, copiati e utilizzati in tutto il mondo entro il 2024 supererà i 149 zettabyte ogni anno e per la maggior parte si tratterà di dati non strutturati. Ogni organizzazione trarrà vantaggio dalla creazione di funzionalità di analisi dei dati non strutturati. Il primo passo di questo percorso consiste semplicemente nel capire cosa distingue i dati strutturati da quelli non strutturati.

Ecco un breve riassunto della differenza tra i due, seguito da spiegazioni più approfondite:

Caratteristica

Dati strutturati

Dati non strutturati

Tipo di dati

Di solito quantitativo

Di solito qualitativo

Modello dei dati

Predefinito; una volta definito e una volta memorizzati alcuni dati, è difficile cambiare il modello

I dati non strutturati non hanno uno schema particolare; il modello dei dati è molto flessibile

Formato dei dati

? disponibile un numero limitato di formati di dati

Per i dati non strutturati è disponibile un'enorme varietà di formati di dati

Database

Vengono utilizzati database relazionali basati su SQL

Vengono utilizzati database NoSQL senza schemi specifici

Ricerca

? molto facile cercare e trovare dati all'interno del database o del set di dati

? molto difficile cercare dati particolari a causa della loro natura non strutturata

Analisi

Molto facili da analizzare, data la natura quantitativa dei dati

Molto difficili da analizzare, anche con gli strumenti software esistenti

Metodo di archiviazione

Per i dati strutturati vengono utilizzati i data warehouse

Per archiviare i dati non strutturati vengono utilizzati i data lake

Slide

Che cosa sono i dati strutturati?

I dati strutturati hanno uno schema ben definito per le informazioni che contengono. Per dare una definizione estremamente semplice, tutti i dati che possono essere presentati in un programma di fogli di calcolo come Fogli Google o Microsoft Excel sono dati strutturati.

In questo esempio, i dati possono essere rappresentati come righe e colonne. Ogni colonna rappresenta un attributo diverso, mentre ogni riga conterrà i dati associati all'attributo per una singola istanza. Righe e colonne formano una tabella a cui è possibile fare facilmente riferimento.

? possibile collegare diverse tabelle, ovvero si possono considerare correlate in base alla colonna comune presente in entrambe le tabelle.

Se più tabelle sono correlate in successione e combinazione, viene creato un database relazionale. Ad esempio, i dati relativi a clienti, vendite e inventario di un grande magazzino possono essere considerati dati strutturati archiviati come database relazionale.

  • Ogni cliente avrà un ID cliente, oltre a campi per il nome, numero di contatto, informazioni sulla carta di credito, indirizzo, ecc.
  • Il database dei clienti può essere collegato al database delle vendite, con attributi quali l'ora di acquisto, i codici degli articoli acquistati, l'importo totale speso, l'ID cliente, ecc. Entrambe le tabelle saranno collegate con l'attributo comune dell'ID cliente.
  • Infine, il database delle vendite può essere collegato al database dell'inventario utilizzando l'attributo comune del codice articolo, collegando di fatto tutte e tre le tabelle in un database relazionale.

I dati strutturati di questo tipo sono generalmente archiviati in sistemi di gestione di database relazionali (RDBMS). I database possono essere scritti, letti e manipolati utilizzando SQL (Structured Query Language), un linguaggio sviluppato da IBM negli anni '70 per supportare i suoi database mainframe (sebbene fosse inizialmente noto come Sequence English Query Language o SEQUEL). ? stato chiamato così poiché si legge più o meno come la lingua inglese. SQL nella sua forma attuale è stato reso popolare da Relational Software, Inc. (nota oggi come Oracle).

Cosa sono i dati non strutturati?

Tutti i dati che non sono dati strutturati possono essere classificati come dati non strutturati. Si prevede che entro il 2025, l'80% dei dati che incontreremo saranno dati non strutturati sotto forma di testo, audio, immagini o video1.

In breve, . Questi dati spesso sono:

  • digitali in origine e imprevedibili
  • sempre in creazione e in movimento
  • misti, multimodali e interoperabili
  • distribuiti geograficamente per una migliore protezione

I dati non strutturati possono avere alcuni metadati associati che possono, a loro volta, avere una struttura. Ad esempio, un video può avere metadati quali risoluzione video, velocità in bit, fotogrammi al secondo (FPS), proprietario del video, ecc. ma il video stesso non è strutturato. Quando sono presenti alcuni metadati strutturati associati a dati non strutturati, questi a volte vengono indicati come dati semi-strutturati.

Guardando più da vicino l'esempio di un video di YouTube, sono presenti alcuni metadati, come l'ora del caricamento, la data del caricamento, il numero di visualizzazioni (parziale o completo), il numero di Mi piace e Non mi piace, ecc. Ma il contenuto all'interno del titolo del video, la descrizione del video e il video stesso non sono strutturati. Hanno un aspetto qualitativo che non può essere acquisito solamente dai numeri.

Il database usato più comunemente per i dati non strutturati è NoSQL. NoSQL sta per "non solo SQL", e indica che il database può gestire una gamma più ampia di dati con funzionalità superiori a quelle dei database SQL. I database NoSQL non hanno uno schema o una struttura tabulare, si tratta semplicemente di una raccolta di dati raggruppati insieme.

?

Storage per dati non strutturati con UFFO

Detto questo, sebbene i dati non strutturati siano potenzialmente in grado di fornire informazioni approfondite con un enorme potenziale di trasformazione, presentano alcune problematiche di gestione. La soluzione di storage avanzata UFFO di Pure, 色控传媒? FlashBlade?, offre la velocità associata alla tecnologia di flash storage, nonché la capacità di scalare qualsiasi architettura in modo agile. Ti interessa scoprirla più in dettaglio? Pure offre una prova gratuita di Pure FlashBlade così potrai provare la soluzione senza alcun impegno.

Soluzioni e prodotti correlati

Soluzione
Data analytics

1https://www.cio.com/article/3406806/ai-unleashes-the-power-of-unstructured-data.html

Potrebbe interessarti anche...

04/2025
Compliance Assessment Report: 色控传媒 FlashBlade File Storage
色控传媒 FlashBlade File Storage: SEC 17a-4(f), SEC 18a-6(e), FINRA 4511(c) and CFTC 1.31(c)-(d) by Cohasset Associates Inc.
Report degli analisti
29 pages

Scopri risorse chiave ed eventi

Storie dei clienti
AC Milan, innovazione dentro e fuori dal campo di gioco

L'AC Milan sta rivoluzionando il proprio ecosistema digitale grazie a 色控传媒.

Scopri di più
THOUGHT LEADERSHIP
La corsa per l'innovazione

Le più recenti informazioni approfondite e opinioni di leader di settore che sono all'avanguardia nell'innovazione dello storage.

Maggiori informazioni
REPORT DEGLI ANALISTI
Pianifica il tuo futuro cyber-resiliente

Scopri le strategie di collaborazione per sfruttare appieno gli investimenti in sicurezza informatica e garantire una risposta e un ripristino rapidi.

Leggi il report
RISORSA
Il futuro dello storage: nuovi principi per l'epoca dell'AI

Scopri come le sfide emergenti come l'IA stanno rivoluzionando le esigenze di archiviazione dati, necessitando di un nuovo pensiero e di un approccio moderno per ottenere successo.

Scarica l'eBook
CONTATTACI
Domande?

Hai domande o commenti sui prodotti o sulle certificazioni di Pure?? Siamo qui per aiutarti.

Prenota una demo

Prenota una demo per vedere come puoi trasformare i tuoi dati in risultati concreti con Pure.?

Telefono:?+39 02 9475 9422

Media:?pr@purestorage.com

?

色控传媒 Italia

Spaces c/o Bastioni di Porta Nuova, 21

Milano, 20121

+39 02 9475 9422

italia@purestorage.com

CHIUDI
Il browser che stai usando non è più supportato.

I browser non aggiornati spesso comportano rischi per la sicurezza. Per offrirti la migliore esperienza possibile sul nostro sito, ti invitiamo ad aggiornare il browser alla versione più recente.