統計ファイル
この記事では、Tableau を統計情報ファイルに接続し、データ ソースを設定する方法について説明します。
Tableau は、SAS (*.sas7bdat)、SPSS (*.sav)、および R (*.rdata、*.rda) データ ファイルに接続します。
注: バージョン 2020.1 以降、SASYZCR2 を使用した統計の圧縮ファイルのサポートが終了します。Tableau でファイルを読みやすくするには、別の圧縮スキームを使用してください。
接続してデータ ソースを設定する
Tableau を起動し、[接続] の下で [統計ファイル] を選択して、接続するファイルを選択して [開く] を選択します。
データ ソース ページで次の手順を行います。
(任意) ページ上部にある既定のデータ ソース名を選択し、Tableau で使用する一意のデータ ソース名を入力します。たとえば、データの他のユーザーが、どのデータ ソースに接続するか推測するのに役立つ命名規則を使用します。
シート タブを選択して分析を開始します。
複数の表への接続については、データの結合を参照してください。
統計ファイル データ ソースの例
Windows コンピューターで Tableau Desktop を使用する統計ファイル データ ソースの例:
次の点に注意してください。
Statistical File コネクタは値ラベルをサポートしません。
統計ファイル コネクタは、統計ファイルごとに 1 つの表のみサポートしています。
次のエラーメッセージ、「データ ソースとの通信中にエラーが発生しました」が表示された場合、統計ファイルにオブジェクトが 1 つしか含まれておらず、そのオブジェクトがデータ フレームかマトリックスであることを確認してください。R ファイルは、クリーンなワークスペースであるように見える非表示のオブジェクトを含んでいる場合があります。非表示のオブジェクトを確認するには、RStudio から
ls(environment(), all.names=TRUE)
を実行します。統計ファイルの文字コードは変更できます。詳細については、「統計ファイルの文字エンコードの変更」を参照してください。
R データ ファイル オブジェクトと形式のサポート
R データ ファイルには、次のタイプのオブジェクトを 1 つのみ含める必要があります。
2 次元マトリクス
ベクトル
要素
データ フレーム
R データ ファイルに複数のオブジェクトが含まれている場合、Tableau は最初のオブジェクトに接続します。
Tableau では、バイナリ形式を使用する R データ ファイルがサポートされています。
Tableau Desktop では、ASCII 形式のファイルはサポートされません。ASCII 形式による .rdata または .rda ファイルを使用しようとすると、「ファイルから読み取れません」「'[TableauTemp].[filename.rdata]' が存在しません」というエラーが表示されます。この場合、次のように Rstudio を使用してファイルをバイナリ形式で保存できます。
- RStudio をダウンロードしていない場合は、ダウンロードします。
- R データ ファイルを RStudio で開きます。右上のグローバル環境ウィンドウにデータ オブジェクトが表示されます。
次のように "save()" 関数を使用して、オブジェクトを新しいファイルに保存します。
save(<objectName>,file="<filename>",ascii=FALSE)
<objectName> は、データ オブジェクト、<filename> は新しいファイルの名前、"FALSE" では大文字と小文字が区別されています。
ヒント: この関数のドキュメントをすばやく表示するには、コマンド プロンプトで "?save" と入力します。
Tableau Desktop では、圧縮ファイルはサポートされません。Tableau に接続する前に、まず別のプログラム (Gzip や WinZip など) でファイルを解凍する必要があります。
統計ファイルの文字エンコードの変更
Tableau はファイルの文字エンコーディングまたは入力ファイル内の情報に基づいて、統計ファイル (SAS ファイル、R ファイルなど) 内のデータを読み取ります。文字エンコード情報をファイル内に含む SAS ファイルや SPSS ファイルと異なり、R ファイルは通常オペレーティング システムの文字エンコードを使用します。場合によって、異なるエンコードを指定する必要が生じることがあります。たとえば、同僚からギリシャ語の文字エンコードで統計ファイルが送られてきた場合は、Tableau でそのファイルを使用するためにギリシャ語の文字セットを指定する必要があります。統計ファイルの読み取り時に異なる文字セットを使用する必要がある場合は、Tableau データ ソース カスタマイズ (TDC) ファイルを作成して、使用するエンコードを指定できます。
TDC ファイルの作成
tdc ファイルは、単一のデータ ソースに適用される XML ファイルで、データ ソース プロバイダーのベンダー名とドライバー名の情報が含まれています。統計ファイル コネクターの場合、ベンダー名とドライバー名は stat-direct
です。
TDC ファイルを作成するには:
ノートパッドなどのプレーン テキスト エディターを開きます。
以下に記載されているサンプルの情報をコピーし、テキストファイルに貼り付けてから、
source-charset
値を指定します。(エンコードのリストについては、「統計ファイル コネクタでサポートされるユーザー定義のエンコード」を参照してください。).tdc 拡張子 (たとえば、
r-statsfile.tdc
) を付けてファイルをマイ Tableau リポジトリ\Datasources フォルダーに保存します。
サンプル TDC ファイルは source-charset 値を設定します
次の TDC ファイルの例では、統計ファイル データ ソースの source-charset
値を shift-jis
に設定しています。
<connection-customization class='stat-direct' enabled='true' version='10.0'>
<vendor name='stat-direct' />
<driver name='stat-direct' />
<customizations>
<customization name='source-charset' value='shift-jis' />
</customizations>
</connection-customization>
重要: TDC ファイルは、接続の機能をカスタマイズしたり、データへの接続に関連する問題を診断して解決したりするために活用できます。Tableau は、これらのファイルに加えられる可能性のあるすべての変更を十分にテストすることはできません。TDC ファイルの作成と使用には手動による編集が必要であり、本番環境に展開する前に十分にテストすることが重要です。
.ttde ファイルおよび .hhyper ファイルについて
コンピューターのディレクトリを移動していると、.ttde または .hhyper ファイルに気づくかもしれません。お使いのデータに接続する Tableau データ ソースを作成すると、Tableau は .ttde または .hhyper ファイルを作成します。このファイルはシャドー抽出としても知られ、Tableau Desktop でデータ ソースの読み込み速度を向上させるのに使用されます。シャドー抽出には参照元データや標準的な Tableau 抽出に似た他の情報が含まれますが、シャドー抽出は別の形式で保存されているため、データの復元には使用できません。
注: Tableau バージョン 2024.2 以降では、.tde ファイルはサポートされなくなりました。すべての抽出は .hyper 形式になりました。
関連項目
- データ ソースの設定 – このデータ ソースにさらにデータを追加したり、データ分析の前にデータを準備したりします。
- グラフの構築とデータの分析 – データ分析を開始します。