データウェアハウス

データウェアハウスとは

データウェアハウス(DWH:Data WareHouse)とは、意思決定のため、目的別に編成、統合されたデータの集合体。DWH製品やサービスの紹介します。

データウェアハウスとは

DWH:Data WareHouseは、「意思決定の為、目的別に編成、統合されたデータの集合体」基幹システム、複数の業務DBに処理、蓄積前のデータ(明細データ:大福帳データ)を保管し、あらゆる切り口で抽出、集計、分析が短時間で可能なシステム。
DWHは、データ量に比例して導入費用が掛かる為、本来明細データを蓄積するべきところを、費用を抑える為に、導入担当者(特に業務をあまり知らない情報システム部)が集計後のデータで長時間(約1年)かけて構築するので、意思決定者にとっては、DWH本番稼働時には、単機能でしか使えないシステムとなる。
DX(デジタルトランスフォーメーション)の必要性が注目され、新たなデータ(ビッグデータ、オープンデータ、エンドユーザデータ)と組み合わせてDX実現する場合、DWHに代わりデータレイクが注目されていますが、新たなデータをフラットに管理し、必要な特に必要な情報を必要な形へ瞬時に対応する「データ整備サービス」が解決します。

関連記事:DX(デジタルトランスフォーメーション)に関する活用シーンはこちら

関連記事:ビッグデータに関する記事はこちら

関連記事:データレイクに関する記事はこちら

主なDWH製品

従来は、専用の機器が用いられるアプライアンス製品として提供されてきました。IBM PureData System for Analytics (旧 IBM Netezza), IBM Integrated Analytics System, Oracle Exadata, Teradata, VMware Tanzu Greenplum (旧 Pivotal Greenplum)
近年では下記のようなクラウドサービスも提供されています。

  • Amazon Redshift,
  • Google BigQuery
  • Azure SQL Data Warehouse

「データ整備サービス」利用例

基幹系システムや業務システムからデータ分析を行うために統合DWHが導入され、BIツールでデータ分析を行う仕組みが大手企業を中心に多くの企業で導入されてきました。
ところが、「年々増加するデータ量に伴い、統合DWHのレスポンスが低下して思うように分析が捗らない」、「社外のデータやエンドユーザの持っているデータも分析に加える必要がある」と言った課題が長年の運用ででてきました。
これらを実現するために、統合DWHを再構築しようとしても高額な費用、長い期間が必要となります。そこで、統合DWHの負荷の高い処理や新たなデータを必要とする処理に「データ整備サービス」を活用することで、統合DWHを再構築することなく課題への対処が可能です。