こんにちは。CData Software Japanリードエンジニアの杉本です。
今回はCDataSyncでCSVデータの取り込みを行う場合によく質問を頂く、S-JIS形式ファイルへの対応の方法について解説したいと思います。
対象のファイル
対象のファイルは内閣府の「国民の祝日について」でダウンロードできるCSVです。
以下のような感じで、ダブルクオーテーション無し、カンマ区切り、かつ日本語ラベル
通常通り接続した場合
これを素直にCDataSyncから接続してみましょう。
「接続」に移動して「データソース」の一覧から「CSV」を選択します。
URIにCSVファイルを配置したフォルダのパスを入力し、「接続テスト」をクリックしてみます。
すると、以下のようなエラーメッセージが表示されました。これはCSVファイルを解析する際に、S-JISフォーマットとして読み取りすることができず発生しているエラーになります。
解決方法
解消方法はAdvanced Tabにある、Other(Optional)に「charset=Shift-JIS」という設定を追加するだけです。
Otherの項目を設定後に改めて接続テストを実行すると、以下のように接続テストが成功します。
また、ジョブを作成してプレビューを実行してみると、ヘッダーと中の値、どちらも正常に取得できていることが確認できます。
おわりに
上記以外にもCDataSyncのCSV Connector は様々な機能をサポートしています。
例えば、Amazon S3のファイルを読み取ったり
ZIP圧縮されているCSVファイルにも対応できます。
気になることがあれば、お気軽にテクニカルサポートまで問い合わせしてみてください。