色控传媒

Skip to Content
ブログ

データ?ウェアハウスとは

データ?ウェアハウスとは

データ?ウェアハウスは、構造化データ向けに最適化されたストレージ?システムで、迅速なビジネス?インテリジェンス(BI)に必要な高速 SQL クエリを可能にします。データ?ウェアハウスは、高速トランザクションから予測型分析まで、企業における BI 促進のためのストレージのデファクト?スタンダートとして使用されてきました。

データ?ウェアハウスの特长

データ?ウェアハウスには、次のような特长があります。

  • 复数の异なるソースから构造化データを集约
  • リレーショナル?データベースの分析クエリを高速化
  • 安価なクエリと迅速なレポート作成のための専用のストレージ?ソリューション

FlashBlade のテストドライブ

Pure1 のセルフサービス?インスタンスによる FlashBlade の管理を通じて、ネイティブなスケールアウトが可能なファイル/オブジェクト?ストレージの先進的機能をお試しいただけます。

テストドライブを申し込む

データ?ウェアハウスの仕组み

有益な情报を抽出するために社内の各部门からデータを収集するロジスティクスは、ビジネスの成长とともに复雑になります。データ?ウェアハウスは、その情报を単一のデータベースおよびデータモデルに集约し、アナリストによるクエリの実行を可能にする信頼性の高い方法を提供します。

仕组みの概要:

  1. 抽出:贰搁笔、颁搁惭、営业、マーケティング部门など、组织内のさまざまなソースから未加工データをステージング?データベースに集约
  2. 変换:ステージング?レイヤーのデータを統合レイヤーに転送し、そこでデータを結合してオペレーショナル?データ?ストア(ODS)に変换
  3. ロード:アナリストが SQL クエリに使用するスキーマを定義することで、データを統合レイヤーからデータ?ウェアハウスに移動した後、リレーショナル?データベースに書き込み(スキーマ?オン?ライト)

データ?ウェアハウスで扱うデータベースはリレーショナル型であるため、データは构造化されており、列と行からなるテーブル形式で格纳されます。これらのテーブルは、书き込み时に定义されたスキーマによって管理されます。

変换のステップがデータ?ウェアハウスの外部にある ODS で処理される場合は、ETL(Extract, Transform, Load:抽出、変换、ロード)と呼ばれます。変换データをデータ?ウェアハウス内部で処理する場合は、ELT (Extract, Load, Transform:抽出、ロード、変换)と呼ばれます。ETL と ELT のどちらを使用する場合でも、データ?ウェアハウスは、構造化データ、スキーマ?オン?ライトでリレーショナル?データベースと連動する必要があります。

データ?ウェアハウスの使用目的

データ?ウェアハウスの一般的なアプリケーション:

  • オンライン?トランザクション処理(OLTP: Online Transaction Processing):データ?ウェアハウスは、大量の短いデータの処理のために最適化され、データの整合性の維持と高速なクエリが可能になります。一例として、高頻度の取引用プラットフォームで行われるトランザクションが挙げられます。
  • オンライン分析処理(OLAP: Online Analytical Processing):データ?ウェアハウスを最適化することで、トランザクション量の比較的少ない複雑なクエリを高速化できます。これは、アナリストが BI レポートを生成するときなどに使用されます。
  • 予測型分析:例えば自社の将来予測と「仮定」のシナリオを生成するために、機械学習アルゴリズムを活用して OLAP システムを最適化します。

データ?ウェアハウスはスキーマ?オン?ライトであるため、データ?ウェアハウスにスキーマを追加する前に、実行予定のクエリのタイプを把握しておくことが重要です。多様なデータソースによる複雑さを解消するために、データ?ウェアハウスをセグメント化してデータ?マートとし、CRM のような特定の事業部門にハードウェア/ソフトウェアのリソースを割り当てるという方法もあります。

データ?ウェアハウス、データ?レイク、データ?ハブの违い

これらは似た概念を持つものと思われがちですが、次のような违いがあります。

  • データ?ウェアハウス:データ?ウェアハウスは、组织内の复数の非构造化データ?ソースから取り込んだ构造化データを统合?格纳する単一のリポジトリです。
  • データ?レイク:組織内(データ?ウェアハウスを含む)のあらゆる構造化および未加工の非構造化データを格納する単一の未精製リポジトリです。このデータから BI のための知見を抽出するには、まずデータを処理する必要があります。
  • データハブ:构造化および非构造化データを集中管理型データ?レイヤーに集约し、一元管理可能にする単一のインターフェースです。オペレーショナル?データも処理できる点でデータ?ウェアハウスとは异なり、复数の形式のデータに対応可能な点でデータ?レイクとも异なります。

データ?ハブは、異なるエンドポイントの集合間でのデータ共有に必要なデータ?ガバナンスを提供します。このように、データ?ハブはデータ?レイクとデータ?ウェアハウスを単一のアクセス?レイヤーに集約します。データ処理が抽象化されるため、BI のための知見抽出を一元化された場所で行うことができます。

データ?ウェアハウスにピュア?ストレージが选ばれる理由とは

既存のデータ?ウェアハウスのインフラに OLAP/OLTP パイプラインを新たに追加する場合には、モダン?データ?エクスペリエンスを実現するピュア?ストレージのオールフラッシュ?ストレージ?ソリューションをおすすめします。

ピュア?ストレージの ?FlashBlade?? は、業界初のデータ?ハブとして、データ?ウェアハウスの分析?レポート生成ワークロードに加えて、次のようなデータ?ハブの特長を備えています。

  • あらゆるデータ?エンドポイント间でシームレスなデータ共有
  • 统合ファイル/オブジェクト?ストレージ
  • オペレーショナル?データをリアルタイムで処理
  • スケールアウトを念头に置いたアーキテクチャ
  • あらゆるデータに多次元的な性能を提供する设计
  • ソフトウェアからハードウェアまで、大规模に并列処理

こちらの资料もご覧ください!

01/2025
色控传媒 FlashBlade//S
FlashBlade//S? is our flagship, all-flash, performance-optimized unified file and object storage platform for your most demanding scale-out storage needs.
データシート
5 pages

リソースとイベントを検索

テックトーク
API でストレージの可能性を最大化

API が可能にするシームレスな性能管理。ピュア?ストレージの API は、自動化と最適化を容易にします。是非詳しくご覧ください!

Web セミナーを視聴する
シンプルさでお客さまにパワーを

業界で最も包括的で一貫性があり、直感的で使いやすいデータ?ストレージ?プラットフォームが、あらゆるワークロードをサポート。IT 部門の運用管理負荷とコストを削減し、重要なプロジェクトへの注力を可能にします。

NAND Research のレポートを読む
リソース
ストレージの未来形:AI 時代の新原則

AI をはじめとする新潮流がデータ?ストレージのニーズを変えています。成功のための考え方と最新の対策を解説します。

eBook をダウンロード
リソース
ストレージの购入から、プラットフォームの导入へのシフト

エンタープライズ?ストレージ?プラットフォームの选び方を、要件、构成要素とともに解説しています。

レポートを読む
ご相谈?お问い合わせ
ご质问?ご相谈

ピュア?ストレージ製品および認定についてのご质问?ご相谈を承っております。ご連絡をお待ちしております。

デモのご用命

ライブデモのご用命を承っております。ピュアがいかにしてデータを成果に変えるお手伝いができるかをご説明します。?

ピュア?ストレージ?ジャパン株式会社

〒100-0014 東京都千代田区永田町 2 丁目 10-3 東急キャピトルタワー 12 階

?

一般:?info-japan@purestorage.com

メディア:?pr-japan@purestorage.com

03-4563-7443(総合案内)

闭じる
このブラウザは现在サポートされていません。

古いブラウザには、セキュリティ?リスクが存在する場合があります。ピュア?ストレージの Web サイトをより快適にご利用いただけるよう、最新のブラウザにアップデートしてください。