CData Software Blog

クラウド連携のCData Software の技術ブログです。

CDataSync のデータソースとして S-JIS形式の CSV ファイルを読み取る方法

f:id:sugimomoto:20210521162321p:plain

こんにちは。CData Software Japanリードエンジニアの杉本です。

今回はCDataSyncでCSVデータの取り込みを行う場合によく質問を頂く、S-JIS形式ファイルへの対応の方法について解説したいと思います。

www.cdata.com

対象のファイル

対象のファイルは内閣府の「国民の祝日について」でダウンロードできるCSVです。

国民の祝日について - 内閣府

以下のような感じで、ダブルクオーテーション無し、カンマ区切り、かつ日本語ラベル

エンコーディングS-JIS形式のファイルでした。

f:id:sugimomoto:20190107143229p:plain

通常通り接続した場合

これを素直にCDataSyncから接続してみましょう。

「接続」に移動して「データソース」の一覧から「CSV」を選択します。

f:id:sugimomoto:20210521162035p:plain

URICSVファイルを配置したフォルダのパスを入力し、「接続テスト」をクリックしてみます。

f:id:sugimomoto:20210521162043p:plain

すると、以下のようなエラーメッセージが表示されました。これはCSVファイルを解析する際に、S-JISフォーマットとして読み取りすることができず発生しているエラーになります。

f:id:sugimomoto:20210521162052p:plain

解決方法

解消方法はAdvanced Tabにある、Other(Optional)に「charset=Shift-JIS」という設定を追加するだけです。

f:id:sugimomoto:20210521162100p:plain

Otherの項目を設定後に改めて接続テストを実行すると、以下のように接続テストが成功します。

f:id:sugimomoto:20210521162110p:plain

また、ジョブを作成してプレビューを実行してみると、ヘッダーと中の値、どちらも正常に取得できていることが確認できます。

f:id:sugimomoto:20210521162118p:plain

おわりに

上記以外にもCDataSyncのCSV Connector は様々な機能をサポートしています。

例えば、Amazon S3のファイルを読み取ったり

www.cdatablog.jp

ZIP圧縮されているCSVファイルにも対応できます。

www.cdatablog.jp

気になることがあれば、お気軽にテクニカルサポートまで問い合わせしてみてください。

https://www.cdata.com/jp/support/submit.aspx