色控传媒

Skip to Content
ビッグデータ?ビギナーズ?ガイド

构造化データと非构造化データ

データの定義およびデータに対する解釈が、この 10 年間で大きく変わりました。非构造化データの読み取り、保存、分析を行うための新たなツールの普及が一因となっています。

従来、非构造化データは、解釈が困难なことが理由で、十分に活用されていませんでした。新たなテクノロジーによって、非构造化データを理解することが容易になり、さらに、非构造化データという情报の宝库から贵重なインサイトを引き出せるようになっています。

、2024 年までに世界中で作成、取得、コピー、消費されるデータの総量は、毎年 149 ゼタバイトを超え、その多くは非构造化データであると予測されています。非构造化データを分析する能力を構築することで、恩恵を得られます。そのためにはまず、构造化データと非构造化データの違いを理解する必要があります。

両者の违いを简単にまとめ、より详细な説明を后述します。

特徴

构造化データ

非构造化データ

データの性质

通常は定量的

通常は定性的

データ?モデル

事前定义。いったん定义され、データが保存されると、モデルの変更は困难。

特定のスキーマは存在せず、データ?モデルは非常に柔软。

データ形式

使用できるデータ形式は限られている

膨大な种类のデータ形式を使用可能

データベース

SQL ベースのリレーショナル?データベースを使用

特定のスキーマを持たない NoSQL データベースを使用

検索

データベースやデータセット内のデータの検索が容易

构造化されていないため、特定のデータの検索が非常に困难

分析

定量的なデータであるため、分析が容易

ソフトウェア?ツールを利用しても、分析は极めて困难

保存方法

データ?ウェアハウスに保存

データ?レイクに保存

Slide

构造化データとは

构造化データは、保持する情報について明確に定義されたスキーマがあります。非常に単純に定義すると、Google スプレッドシートや Microsoft Excel などの表計算プログラムで表せるデータは全て构造化データです。

この场合、データは行と列で表现されます。各列は异なる属性を表し、各行は単一のインスタンスの属性に関连付けられたデータを持ちます。行と列によって、容易に参照できるテーブルが形成されます。

异なるテーブルを连结することもでき、両方のテーブルに存在する共通の列によって関连付けられていることになります。

複数のテーブルを連続して組み合わせて関連付けることで、リレーショナル?データベースができあがります。例えば、デパートの顧客データ、売上データ、在庫データなどは、リレーショナル?データベースとして保存されている构造化データです。

  • 各顧客には顧客 ID のほか、氏名、連絡先、クレジット?カード情報、住所などのフィールドがあります。
  • 顧客データベースは、売上データベースと接続することができ、購入時刻、購入品のアイテム?コード、購入金額、顧客 ID などの属性を持つことができます。これらのテーブルは、顧客 ID という共通の属性で関連付けられています。
  • さらに、アイテム?コードという共通の属性を使用して売上データベースを在庫データベースに接続することで、リレーショナル?データベースに 3 つのテーブルを効果的に相互接続することができます。

このような構造化されたデータは、一般的にリレーショナル?データベース管理システム(RDBMS)に格納されます。データベースは、SQL(Structured Query Language)を使用して記述、読み取り、操作することができます。SQL は、1970 年代に IBM 社がメインフレームのデータベースをサポートするために開発した言語で、当初は、SEQUEL(Sequence English Query Language)と呼ばれていました。英語とほぼ同じように読めることからこう呼ばれるようになりました。現在の形の SQL は、Relational Software, Inc. 社(現 Oracle 社)によって広められました。

非构造化データとは

非构造化データとは、構造化されていないデータを意味します。構造化されていない全てのデータが非构造化データに分類されます。2025 年には、扱うデータの 80% がテキスト、音声、画像、动画などによる非构造化データになると予測されています。1

すなわち、といえます。非构造化データには、次のような特徴があります。

  • 本质的にデジタルで、予测不可能
  • 常时生成され、动的に変化する
  • ブレンド、マルチモーダル、相互运用が可能
  • 地理的な分散により保护される

非构造化データには、構造を持つメタデータが関連付けられている場合があります。例えば、动画には、解像度、ビットレート、1 秒あたりのフレーム数(FPS)、所有者などのメタデータを関連付けることができます。しかし、动画自体は構造化されていません。構造化されたメタデータが関連付けられている非构造化データを、半构造化データと呼ぶことがあります。

YouTube の动画を例に挙げると、アップロードした日時、視聴回数(部分?全体)、評価の数といったメタデータが存在します。しかし、动画自体の内容、タイトルや説明文は構造化されていません。それらは、単純に数字だけでは捉えられないという特徴があります。

非构造化データ用のデータベースとして最もよく使用されているのが NoSQL です。NoSQL は「not only SQL」の略で、SQL データベースのケイパビリティを超えて、より広範囲のデータを扱えることを示しています。NoSQL データベースには、スキーマや表形式の構造はなく、データをグループ化するだけです。

?

UFFO を利用した非构造化データの保存

非构造化データを活用することで、大きな変革の可能性を秘めた重要なインサイトを提供できるかもしれませんが、それにはさまざまな課題が存在します。ピュア?ストレージの先進的な UFFO ストレージ?ソリューションである FlashBlade は、フラッシュ?ストレージ技術による優れたスピードを提供するだけでなく、あらゆるアーキテクチャを俊敏に拡張する能力を備えています。ご興味をお持ちのお客さまには、ピュア?ストレージの FlashBlade を無料でお試しいただけるテスト?ドライブをご用意しています。

関连製品とソリューション

ソリューション
データ分析

1https://www.cio.com/article/3406806/ai-unleashes-the-power-of-unstructured-data.html

こちらの资料もご覧ください!

11/2025
FlashBlade Data Protection with Rubrik
Rubrik and 色控传媒 have partnered to provide an integrated, performant, and simple-to-manage solution that will enable IT professionals to seamlessly protect and restore content for the 色控传媒 FlashBlade? array.
ホワイト?ペーパー
28 pages

関连リソースとイベント

动画
动画:エンタープライズ?データ?クラウドのメリット

会長兼 CEO のチャーリー?ジャンカルロが、ストレージ管理からデータ管理へのシフトこそが未来である理由を解説します。統合により、エンタープライズ IT の運用管理がいかに変わるかがわかります。

视聴する
リソース
従来のストレージは未来を支えません。

近代的なワークロードには、AI 対応の高速性、セキュリティ、拡張性が求められます。スタックの準備はできていますか?

现行のサイバー対策を评価する
Pure360 デモ
ピュア?ストレージを探索、体験、学习できます。

ピュア?ストレージの製品や機能をご紹介するオンデマンド动画/デモ付き动画をご用意しています。是非ご利用ください!

デモ动画を見る
ソート?リーダーシップ
イノベーション竞争

ストレージ技术革新の最前线に立つ业界リーダーによる最新のインサイトと展望。

详しく见る
このブラウザは现在サポートされていません。

古いブラウザには、セキュリティ?リスクが存在する場合があります。ピュア?ストレージの Web サイトをより快適にご利用いただけるよう、最新のブラウザにアップデートしてください。