CData Software Blog

クラウド連携のCData Software の技術ブログです。

企業データをデータウェアハウスに統合すべき10の理由

優秀なリーダーたちは企業組織をデータで変革しています。整理された数字を使って経営判断を行い、チームを数値化されたゴールに向かって動かします。より高い効率、スピードのある生産、より低いコスト---これらを達成するのは企業データを使いこなす者のみです。

f:id:cdatasoftware:20181210205435p:plain

異なる事業プロセスのために利用するアプリ・ツールは増加し続けています。そしてアプリ・ツールはそれぞれ異なるデータを生成します。成功のカギは増加する大量のデータを管理することです。

データウェアハウス(DWH)とは?

データウェアハウスは、データベースとは異なります。データウェアハウスとは、エンタープライズのさまざまな業務システムから集められた異なるデータベースのデータすべてを1つの標準に束ねるフェデラルな(訳者注:フェデラルは「連邦」と訳されることで知られる個々の構成要素が残りつつ包括されている集合体を表す)レポジトリです。データウェアハウスでは、トランザクションの処理ではなく、バラバラの企業データ(大量データを含む)を捉え、アクセス可能にし、分析を行うことが重要です。

企業データの分析を可能にするデータウェアハウスはあらゆる企業に多くのメリットをもたらします。

データウェアハウスに企業データを統合する10のメリット

1. データの整合性

適正に配置されたデータウェアハウスは、さまざまなところから発生するデータを統一されたフォーマットに変換することができます。データウェアハウスに標準化されたフォーマットでデータが入れば、複数の部署のアナリストたちが管理・標準化され、セキュアなデータにアクセスすることができます。これにより、アナリストに必要な多くのデータを提供しつつ、組織内でデータ利用プロセスを標準化し、整合性を担保することができます。

2. 360°分析

データウェアハウスは、複数のソースからのデータを集計し、アクセス可能な集中ストレージに保管するようにデザインされています。一つの場所に、そして標準化されたフォーマットでデータを統合することにより、アナリストはより完全な360°ビューを得ることができます。企業内でおこっていることのより深く、そして広いトレンド分析を行うことができます。

3. 組織アラインメント(統一目線)強化

より適切な360°ビューによるインサイトおよび複数の部署(営業、マーケティング、バックオフィス、サポートなど)が報告に同じレポジトリを使うことで、それぞれの部署の報告が他の部署と同じ目線となります。ステークホルダーたちは組織全体で何が起こっているのかを同じ目線で見ることが可能になります。

4, パフォーマンス

データを作成し変更をすることにフォーカスして作られている業務処理用のデータベースとは異なり、データウェアハウスはデータの集積および分析にフォーカスして作られています。これにより、大きな規模のデータを保存すること、およびハイパフォーマンスをスケーラブルに実現することができます。これによりBI ツールや分析ツールから効率的にクエリを実行し、サクサクと分析を行うことができます。

5. API 管理をシンプルに

データウェアハウスはAPI 管理の悩みを回避してくれます。データウェアハウスにより、それぞれのアプリケーションおよびデータベースの異なるAPI への毎回の連携を行う必要がなくなります。ただ、データソースからデータをデータウェアハウスに丸ごと複製(レプリケーション)してしまえばよいだけです。データ取得に多くの時間をかけたり、ミスの多い処理を行う必要なありません。また、以降は新しいデータだけを複製する差分更新を行うことで、データウェアハウスは最新の状態に保たれ、大量データの同期に通信容量を必要以上に使ってしまう恐れもありません。

6. API 制約の回避

データの複製を行うもう1つのメリットは、面倒なAPI 制限を回避することができることです。それぞれのデータソースのAPI にはクエリに時間がかかるものやタイトなクエリ制限があるものがあります。直接ではなく、複製されたデータへのクエリするにより、そのような制限を気にすることなく分析を行うことができます。

7. 時系列的な分析

データウェアハウスは、ペタバイトクラスの企業データを扱うことができます。1ペタバイトは、1000テラバイト、もしくは100万ギガバイトです。このように大きなデータを扱えるデータウェアハウスには複数年度にわたる時系列データをストアすることができ、より長いスパンのトレンド分析が可能です。時系列データは将来の予測には欠かせません。このような大量の時系列データはトランザクション向けのデータベースにストアし、分析するには不向きです。データベースは簡単にオーバーロードし、クエリ結果を返せなくなるでしょう。

8. コスト削減にによる167% のROI

IDC による調査 によると、データウェアハウスの3年のROI の中央値は167% だそうです。これは小規模から大規模の複数の業種にわたる企業での調査結果とのことです。平均ROI は400% にのぼったそうです。なぜでしょうか?データウェアハウスはデータ連携のコストを圧倒的に削減したからです。企業はより小さなプロジェクトから始め、投資回収を平均1.5年に早めることができたとされています。

9. 普及期・成熟期で低リスク

エンタープライズ向けデータウェアハウスは市場に出てから長い時間が経過しています。軍、諜報機関、製造業、銀行、ファイナンス、および小売業では1960年代からデータウェアハウスが使われてきました。1990年代にはIT ソリューションとして勃興し、Walmart がデータウェアハウス活用で大きく市場を変えました。Walmartサプライチェーン成功の裏には、それぞれのPOS データから収集された購買データのデータウェアハウス活用による1億を超える消費者の購買行動と2万5千のサプライヤーロジスティクスを最適化がありました。それ以来、データウェアハウスは多くの大企業で導入され、世界中で導入モデルが発展しました。

また、現在の主要なデータウェアハウスのプロバイダーはAmazonIBMMicrosoftOracleGoogle、Teradata などのテック業界の巨人たちであり、大規模なWeb ベースのサービスを素晴らしいサポートレベルで提供しています。

10. セキュリティ:統合データアクセス権限

データウェアハウスであは、統合データアクセス権限の設定によりセキュリティを向上させられます。統合されたシステムでデータにアクセスさせることにより、ロールベースのアクセス権限設定を行い、ユーザー毎に異なるアクセス権限を付与することが行レベル(Row-level)で設定可能です。行レベルのアクセス設定はセキュリティ面で多くのメリットがあります:

  • より細やかな権限設定(テーブルやカラムレベルよりも)

  • グループ、ロール、アプリケーションなどによる自動データフィルタリング

  • サーバー側でのデータセキュリティ

こういったコンプライアンス要求への対応は、ヘルスケアなどの規制業種では特に重要です。このようなセキュリティ機能は主要なデータにアクセスでは標準的に提供されています。

CData Sync:データウェアハウスにあらゆるデータを同期(複製)!

ただし、データウェアハウスが企業で利用するすべてのデータに対応していない場合にはどうすればいいでしょう?どうやってデータソースからデータウェアハウスにデータを同期(複製)すればいいでしょう?

CData Software にお任せください。CData Sync は企業で利用される100を超えるデータソース(SaaS、NoSQL、RDB、Web API)をお好みのデータウェアハウスに同期できる便利なツールです。Amazon S3、Redshift、Google BigQuery などお好みのデータウェアハウスのデータ取り込み機能をCData Sync が拡張します。

CData Sync の詳細を是非ご覧ください:https://www.cdata.com/sync/