データレイク・データドリブン
DXが本格化する中、企業が扱うデータは、基幹系システムや業務システムだけでなく、自社サイトやEC、SNSログ、IoTデータ等多種多様になり、データ量も爆発的に増えています。そこであらゆるデータを蓄積するデータレイク、データをもとに意思決定を行うデータドリブン経営が注目されています。
顧客
- 部署:DX推進部
- 利用シーン:データレイク・データドリブン
背景
データ量の急増や、様々なクラウドサービス活用によりオンプレミスだけでなくクラウド上のデータを扱うことが増えていました。そこで、オンプレミスのデータウェアハウス(DWH)にかえて、クラウドでのデータ管理に取り組みましたが、オンプレミスよりもデータ管理の自由度が低下し、データ分析の処理時間が今まで以上にかかるようになっていました。
課題と効果
-
クラウド上のデータレイクからのデータ取得にETLツールを使用しているが、スピードが上がらない。処理内容の変更もSQLの知識が必要になるところがあり難しい。
→
オンプレミスに構築したデータレイクのデータをREALISMで処理することにより、専門知識がなくても担当者自身が簡単にデータ加工・処理をスピーディーに行えるようになり、経営判断・意思決定が加速した。
-
データレイクと連携したクラウド上のBIツールで処理しているが、従来よりもデータ処理や分析に時間がかかるようになった。
→
オンプレミスに構築できるオブジェクトストレージ製品HYPERSTOREでデータレイクを構築することで、あらゆるデータをオンプレミスに蓄積できるようになり、従来と同様の使い慣れたBIツールを使うことができた。データの前処理をREALISMで行うことで、大量データでもレスポンスの低下を感じなかった。
-
DX推進を経営層から求められているが、現在のシステム環境では難しく、再構築に多大な費用や時間がかかる。
→
新しいデータや一時的なデータ処理は、データ整備サービスを使うことでシステム構築することなく結果を確認できた。今後も処理が必要になれば、REALISMのバッチ処理で定型レポートを出力することができ、様々な要望に素早く対応できるようになった。
利用イメージ
基幹系システムからデータ分析を行うためにデータウェアハウス(DWH)を導入して、BIツールでデータ分析を行われていました。デジタルトランスフォーメーション推進のため、オンプレミスのDWHにかえて、クラウド上にデータレイク、クラウドDWHの構築を試みましたが、かえってデータの取り扱いが不自由になっていました。また、クラウドからのデータ取得、加工にETLツールを使用していましたが、期待していたレスポンスが出ず、様々なデータでアドホック処理を行えるような状況ではありませんでした。そうした中、オンプレミスにHYPERSTOREとREALISMを連携したDX推進データ活用プラットフォームを構築することで、多種多様なビッグデータをHYPERSTOREに蓄積し、蓄積したデータをREALISMで超高速データ整備し、BIツールでビジュアライズすることができ、データドリブン経営を実現することができました。
参考:オブジェクトストレージHYPERSTOREとは
データレイクの実現には、ファイル文書、写真、動画、ログ等、大量のデータ保存が求められます。オブジェクトストレージは、データレイク/DXの実現に必要不可欠なストレージです。
- ファイルとメタデータをセットにしたオブジェクトというフラットな単位で格納するため、大量データを扱うことができ、世代管理が可能です。
- データ量の増加とともにサーバ台数を追加するだけで、最小10TBから無制限に拡張可能です。
- IoT機器など様々なデバイスや移動先、自宅、遠隔拠点からインターネット経由のアクセスが可能です。
- 1台は本社、1台は支店、1台はクラウド事業者という設置が可能です。災害対策にもなります。Amazon S3 APIに完全準拠しているため、多くのクライアントやアプリを改修せず利用できます。
関連動画:データレイク・データドリブン