CData Software Blog

クラウド連携のCData Software の技術ブログです。

Sansan の名刺データをAmazon RedShiftへノーコードでデータ連携してTableauで可視化する:CData Sync

こんにちは、CData の宮本です。

今回は Sansan の名刺データを Amazon RedShift へ連携し、BIツールの Tableau で可視化する内容をご紹介します。

CData Sync とは

f:id:sennanvolar44:20200501163232p:plain

https://www.cdata.com/jp/
クラウドサービスからデータベースへのノーコードレプリケートアプリケーションになります。レプリケートとは同期するという意味になりますので、CDataSync から接続できるクラウドサービスのデータをデータベースにまるっとコピーすることができます。


機能の特徴としては、接続先が豊富なことが挙げられます。連携先に主要な RDB をはじめ、クラウドDWH( BigQuery や RedShift など) や CSVAccess といったところまでをサポートしています。また一部のデータソースにおいては差分更新も可能になっています。
f:id:sennanvolar44:20200501174346p:plain

環境・準備

f:id:sennanvolar44:20200515180259p:plain
Sansan と RedShift に接続できる環境に CDataSync を配置し、CDataSync で作成したレプリケートジョブを実行することで Sansan と RedShift 間の同期を行います。Tableau は RedShift へのアクセスだけで、Sansan のデータを参照することができます。

本構成で必要なものは以下の通りです。
* CDataSync
(後述するインストール手順でダウンロードリンクを載せています)

<以下は本記事での環境構築等の説明はありませんのでご注意ください>
* Sansan アカウント
* Amazon RedShift の環境
* Tableau

CData Sync インストール

まずは以下のリンクよりCData Sync をダウンロードします。
https://www.cdata.com/jp/sync/
なお、CData Sync はWindows版、Java版、AMI版と3種類存在しますので、実行環境に合ったものを選択ください。
f:id:sennanvolar44:20200503013133p:plain

ダウンロードしたインストーラーを実行します。基本的にデフォルトのまま次へと進んでしまって構いません。
f:id:sennanvolar44:20200503013558p:plain

以上で準備が完了しました。

手順

ここからはデータ連携 ~ Tableauで可視化する手順になります。

Sansan から RedShift への連携

Sansan への接続設定
まずは接続設定を行います。ヘッダーメニューの「接続」から接続画面を表示 → データソースタブから Sansan アイコンをクリックし、以下の画面が表示されるので Sansan のアカウント情報を入力します。
※データソース一覧に Sansan のアイコンがない場合は、「+Add More」からインストールすることができます。
f:id:sennanvolar44:20200515141526p:plain
Range に me と入力していますが、これは自分が交換した名刺データだけを抽出するようにしています。所属している組織のメンバーが交換した名刺データを取得したい場合は all と入力します。

RedShift への接続設定
こちらも同じように接続設定を行いますが、データソースタブではなく、同期先タブより RedShift のアイコンをクリックし、接続情報を入力します。 f:id:sennanvolar44:20200503025312p:plain

連携ジョブの作成
CData Sync のTOP画面にて「ジョブを追加」から以下の内容を選択して作成します。
f:id:sennanvolar44:20200515144901p:plain

名刺データは「Bizcards」にありますので、「テーブルを追加」から「Bizcards」を選択します。
f:id:sennanvolar44:20200515145753p:plain

連携ジョブを実行
ジョブを実行するには、作成したクエリにチェックを入れて実行ボタンをクリックします。正常に処理が終了すると、実行日時とレプリケートした件数が表示されます。
f:id:sennanvolar44:20200515150726p:plain

Sansan で RedShift のデータを可視化する

新しいデータソースより RedShift を選択し、接続情報を設定します。
f:id:sennanvolar44:20200503033208p:plain

接続できると、先ほどCData Sync でレプリケートした Sansan の bizcards を選択することができます。
f:id:sennanvolar44:20200515152730p:plain

こちらは去年交換した名刺データをもとに、月ごとの交換枚数と効果相手の所属会社の位置を表示した内容です。
上のグラフでは Exchangedate(交換日)をもとにしています。下の地図は、Mapbox というオンラインカスタムマップを Tableau に連携して表示しました。
f:id:sennanvolar44:20200515162620p:plain

まとめ

CData Sync では Sansan、RedShift 以外にもさまざまなデータソース、データベースを使用することができます。 是非ご興味がある組み合わせでCData Sync をお試しください(30日間無料でご利用いただけます)

www.cdata.com

関連記事として、Salesfortce、kintone を RedShift へ連携して Tableau で可視化する内容も紹介しております。

www.cdatablog.jp

www.cdatablog.jp