こんにちは、CData Japan ローカライザの加藤です。
企業のデータ活用が推進され新たなニーズが生まれる中で、パフォーマンスやコストといった面からこれまでのデータ基盤を一新したい、という企業にとって、既存のデータ分析環境を維持できるのか、というのは重要な要素です。今回はUS の記事から、150TBものデータを新しいデータウェアハウス(DWH)に移行した後も、CData ドライバーを活用することで既存の分析ツール(SSAS)を利用可能な環境を、簡単に維持することができたお客様の事例をご紹介します。
元記事はこちら
SQL Server Analysis Services(SSAS)はデータから高次元な集計を作成し、ユーザーが動的なレポートやダッシュボードを作成してKPI(Key Performance Indicators)などの評価指標をまとめるのを支援します。CData では、ユーザーが企業のデータに、そのデータがどこに格納されていようとSSAS の分析機能を適用可能にする連携を提供します。
本記事では、CData があるお客様をお手伝いして、数百テラバイトものデータをSnowflake データウェアハウスへ移行した事例をご紹介します。
問題
ある大規模グローバル小売企業は、150TB もの業務データをSnowflake に移行して、その後も分析とデータマイニングにSSAS を使い続けたいと考えていました。企業のビジネスチームは、これまでのデータモデルをもとにSSAS 内に一群のOLAP キューブ(以下を参照)を作成しました。チームはSnowflake データを使って同じキューブを作成しようとしましたが、ネイティブやオープンソースの連携方法ではSQL Server と連携するために必要な機能が使えないため、ニーズを満たすことができませんでした。
OLAP キューブは多次元キューブ、ハイパーキューブとも呼ばれますが、集計データを持つデータ構造であり、各種の値が事前に計算されているため即座にデータ分析を始めることができます。
ソリューション
最終的にチームは、CData を採用してSnowflake をSSAS と連携し、OLAP キューブを作成することに決めました。CData 製品は、Snowflake に対して直接SQL クエリを発行できるインターフェースを提供し、エンジニアが素早く簡単に、以前作成したキューブを直接Snowflake のデータに紐付けることを可能にします。キューブがデプロイされると、ビジネスチームは再びデータを分析、処理、マイニングできるようになりました。
プロセス
CData ADO.NET Provider をインストールするだけで、ビジネスデータからキューブを作り、SSAS プロジェクト内にデータソースとビューを作成して、データからキューブを構築してデプロイすることができます。以下で基本的なプロセスを説明し、さらに詳細な記事をご紹介します。
Snowflake のデータソースを作成する
SSAS プロジェクト内で「新しいデータソース」を作成し、「CData ADO.NET Provider for Snowflake」を選択してSnowflake の資格情報を入力します。
データソースビューの作成
データソースの作成後、「新しいデータソースビュー」を作成し、作成済みのデータソースを選択して外部キーのマッチパターンや、追加するテーブルを選びます。
Snowflake のキューブを作る
最後に、「新しいキューブ」を作成して、キューブに追加したいテーブルとメジャー、作成するディメンションを選択します。
これで、分析、レポーティング、データマイニングなどに使用可能なSnowflake のOLAP キューブの完成です。
より詳細な手順については、ナレッジベースの記事を参照してください。
ビジネスデータから意思決定に繋がる洞察を得る
標準ベースの連携を使うことで、CData ユーザーの皆さんはどこにデータが格納されていても、ビジネスデータをお好みの処理やプラットフォームで扱うことができます。今回のケースでは、新しいDWH にビジネスデータをすべて移動しても、SSAS データキューブを継続して使用できました。
CData ADO.NET Providers for Snowflake についてはこちらのページをご覧ください。無償の30日間評価版をダウンロードすれば、CData 製品の一味違う連携機能を体感いただけます。