データマート

マスターデータ管理

現代では企業が扱う情報量が膨大になっており、ビッグデータの活用はビジネスにおいて非常に重要な要素です。

企業が最適な意思決定をするためにはデータの分析が不可欠でありスピーディーな意思決定のために、「データマート」が重要な役割を果たします。

データウェアハウス等の概念と非常に混同しやすいため、それぞれを整理しつつ理解を深めていくことが重要でしょう。

そのため今回は、データマートの概要やメリット・デメリット、データレイクとの違いなどについて解説していきます。

関連記事:データウェアハウスに関する記事はこちら

データマートとは

データマートとは

データマートとは、組織内の特定の部門やチームが特定の目的(マーケティング、セールス、人事、財務など)を満たすために構築するデータベースです。データウェアハウス内のデータを抽出したり、あらかじめ集計したりしたデータウェアハウスのサブセット(部分集合)を指すことが多いです。

データウェアハウスとデータマートの関係は、データウェアハウス(倉庫)からデータマート(市場、販売店)にデータが供給されるというような関係です。

企業内に散在したデータを統合し、企業の意思決定に利用するのがデータウェアハウス。データウェアハウスに格納されたデータを抽出や集計などして、特定の部門が特定の目的に利用するのがデータマートです。例えば、全部門に関わる通販サイトの売上データがデータウェアハウスで管理されていて、その中から企画部が分析に使うために必要なデータだけを抽出して分析しやすい形に加工して保存するのがデータマートということになります。

しかし、データマートが必ずデータウェアハウスとセットで構築されるというわけではありません。データウェアハウスを利用せずに、特定の部門が利用するために構築される「独立型データマート」も存在します。

これまでに説明していたデータウェアハウスのデータに完全に依存するデータマートは「従属型データマート」といえます。その他にデータウェアハウスのデータを利用しながら、それ例外のデータも取り込むデータマートのことを「ハイブリッド型」と表現することもあります。

2010年代(ビッグデータが注目されて)以降、データレイクとデータウェアハウスとを組み合わせて構築されることもあります。

データウェアハウスには膨大な情報が格納されていますが、情報の分析には一定のスピード感が求められます。

そのため、特定の部門が目的のために必要な情報だけ抽出して加工・利用する手法が重宝されます。

データマートとデータウェアハウスの一般的な関係

データマートの定義

データマートとは、企業を始めとする組織の情報システムに貯蓄された情報から、特定の部門が目的に応じて必要な情報だけを抽出・加工して格納したリポジトリー(保管場所)のことです。

企業が持つ情報全体のことではなく、その中で特定の目的に使える情報を取り出し、目的別にまとめ直したものだとイメージすると良いでしょう。サイズが小さくて比較的構築しやすく、ユーザの要求に早期に応えることができます。

データマートの3つの種類

データマートは以下の3種類に分類できるため、それぞれについて説明していきます。

独立型データマート

独立型データマートとは、データを収集する際にデータウェアハウスを利用せずに作成された、スタンドアロン(孤立)のデータマートのことを指します。

組織内または外部のどちらか一方または両方のデータソースから情報を抽出し、リポジトリー(保管場所)に保管されます。

小規模なグループやセクションに適しており、難解な開発や設計を必要としないため短期的な目標を迅速に達成する際には最適です。

ただし整備されていない、いわゆる「汚れたデータ」から必要な情報を集めることが多いためデータを統合するプロセスが煩雑になる傾向があります。

従属型データマート

従属型データマートとは、組織内で既に作成されているデータウェアハウスから情報を抽出し、作成されるデータマートのことを指します。

従属型データマートの場合、既に中央のデータウェアハウスにある整備された情報から抽出を行うため、ある程度のプロセスの簡略化が可能です。データウェアハウスから必要な情報を特定し、集約・再構成を行って格納します。

従属型データマートはデータウェアハウス内の情報を部分的に再構築したものであるため、情報の一元管理ができます。

ハイブリッド型データマート

ハイブリッド型データマートとは、中央のデータウェアハウスと他の運用システムの情報両方を組合わせて使用するデータマートのことです。ハイブリッド型は従属型と独立型の特徴を兼ね備えており、特別な統合や異なるソースからの情報をすぐに利用したい際に利用されます。

ハイブリッド型データマートはデータウェアハウス以外のソースからの情報も抽出されているため、最終的にはデータウェアハウスに統合することが理想と言えるでしょう。

データマートとデータウェアハウス、データレイクの違い

データマート、データウェアハウス、データレイクの違い

ここからは、データマートについて解説する際に似ている概念としてよく挙げられる、3つの概念との違いについて解説いたします。

データウェアハウスとは

データウェアハウス(Data Ware House)とは、複数のシステムにある情報を収集し、目的別に再構成した統合データベースのことです。

組織の意思決定やそのためのデータ分析などを目的として構築されるため、BI(ビジネスインテリジェンス)の1つであるとされています。

組織が扱う膨大な情報を利用しやすいよう、目的別・時系列に整備して保存するのが、データウェアハウスの目的だと言えます。

例えば、企業が持つ顧客の属性や購買履歴、趣味嗜好の情報などを掛け合わせて分析したいような時に、データウェアハウスは重宝します。

データマートとデータウェアハウスとの違いを理解しよう

データマートとデータウェアハウスの違いを表に整理します。

データマート データウェアハウス
目的 特定部門(ビジネス)の戦術的な意思決定 企業の戦略的な意思決定
データ 特定部門が必要な小規模なデータ 企業内の様々な部門やシステムから収集して統合した大規模データ
データ特徴 分析のため抽出、集計データ集計値など更新がある 明細データ追加のみ、削除や上書きしない
利用者 特定の部門、チーム 企業のすべての部門
企業全体
構築期間 数か月以内 半年から数年

注目されているデータレイクとデータウェアハウスの違い

データウェアハウスの説明時によく出てくる概念として、データレイクも挙げられます。

データレイク(Data Lake)とは、規模に関わらず全ての構造化データと非構造化データを保存できるリポジトリーのことです。

データレイクを活用することで情報の一元管理が実現し、業務の効率化に役立ちます。

また、形式を問わず様々な情報を蓄積できるため、必用な情報も簡単に抽出しやすいです。

多くの情報を蓄積していく点で、データウェアハウスとデータレイクは似ています。

しかしデータウェアハウスがデータを整備した状態で蓄積していくのに対し、データレイクは加工していない生のデータを蓄積していく点で両者は異なっています。

関連記事:データレイクに関する記事はこちら

データマートを構築するメリットとデメリット

データマートを構築するメリットとデメリット

ここからは、データマートを構築するメリットとデメリットについてそれぞれ解説していきます。

データマートを構築するメリット

データマートは、データウェアハウスと比較することで構築のメリットが見えてきます。

利用者からみると、データウェアハウスと比較してデータサイズが小さく、アクセスユーザが限定されるため、レスポンス向上に役立ちます。(データウェアハウスと比較して)構築が容易であり、分析条件の変更などにも柔軟に取り組みやすくなります。

データマートのメリットは、以下のように整理できます。

データサイズが小さく、開発コストが比較的かからない

独立型データマートであれば1週間程度で稼働開始ができるため、必要な情報が少ない場合にはデータウェアハウスを構築するよりも安価かつ早期に開発できます。

組織が意思決定する際にデータセットへアクセスする時間を短縮できる

データマートは特定の目的に合わせて構築されており、比較的早期に確認・分析が可能です。

データウェアハウスの強化につながる

従属型・ハイブリッドデータマートであれば、処理の負担を取り除くことでデータウェアハウスのパフォーマンス向上に寄与します。

データマートを構築するデメリット

逆にデメリットは、データマートに取り込まなかったデータを分析できなくなるということがあります。また、データウェアハウスに加えて、追加でデータマートの構築コスト、運用コストが発生することになります。

企業の必要に合わせて、データウェアハウスが必要か、データマートが必要か、両方が必要か、構築前に検討する必要があります。

データウェアハウスは、専用のアプライアンス製品が数多く存在しますが、データマートは、RDBMSで構築されることが多いです。

データマートのデメリットは、以下のように整理できます。

限定的な情報を扱っているのため、大規模な分析には不向き

現在ではユーザの求めるニーズが、データマートで分析できる範囲では収まらなくなっており、不十分な局面も比較的多いと言えます。

情報のやりとりが非効率で、運用にはコストがかかる

構築にかかる時間・コストは低いのですが、その後の情報のやり取りが非効率だと言えます。

データマートに役立つおすすめのツール「データ整備サービス」

データ整備、レポート

ここでは、日本ソフト開発株式会社が提供する「データ整備サービス」の概要について解説していきます。

データ整備サービスの3つの特徴

データ整備サービスには、3つの大きな特徴があります。

①定額料金

データ整備サービスでは、データ件数に関わらず一定の料金でサービスをご利用いただけます。

②最短2日

データ整備サービスはスピード感を大切にしており、短期間(最短2日)でデータ内容確認・データ整備を実施いたします。

③分かりやすく

データ内容の確認とデータ整備を繰り返し行うことで、データを分かりやすい情報にまとめます。

データ整備サービスの詳細

データ整備サービスでは「データ確認」と「データ整備」を繰り返し、データ活用の課題解決をお手伝いいたします。

データ整備のStep1 データ確認

CSVファイルとテーブル編集仕様をお預かりし、データ確認レポートを短期間(最短2日)で作成いたします。

テーブル編集仕様の作成をお客様で行うことが難しい場合は、弊社にて作成サポートも行っていますのでご安心ください。

データ整備のStep2 データ整備

いただいたテーブル編集仕様を元に、お預かりしているCSVファイルを整備・加工して、短期間(最短4日)でCSVファイルをお返しいたします。

データ整備のStep3 データ再確認

データ整備が終わった後のCSVファイルがテーブル編集仕様に沿ったデータであることを、データ確認レポートによって確認いたします。

もしER図をいただくことができれば、テーブル間整合性レポートの作成も合わせていたします。

データ整備サービスで企業のお悩み解決

データ整備サービスをご利用になることで、企業が持つ以下のようなお悩みを解決することができます。

デジタルトランスフォーメーション(DX)関連のお悩み

「デジタルトランスフォーメーションを進めるために今あるデータの内容を確認しているが、データ量、データ数が多くて、手に負えない」

AI関連のお悩み

「AI用の機械学習(学習データ、適用データ、テストデータ)データ整備を複数人で作成しているが、品質にばらつきがあり、AIで思うような結果が得られない」

データ移行時のお悩み

「ERPシステムをクラウドサービスに移行したいが、データ移行費が高い」

「汎用機からオープン系へのマイグレーションに伴うデータ移行の工数を削減したい」

前の記事

データ準備

次の記事

名寄せ