統計檔案

本文介紹如何將 Tableau 連線到統計檔案並設定資料來源。

Tableau 可連線到統計分析系統 (*.sas7bdat)、SPSS (*.sav) 和 R(*.rdata、*.rda)資料檔案。

附註:從版本 2020.1 開始,Tableau 不再支援使用 SASYZCR2 壓縮的統計檔案。使用其他壓縮配置,讓 Tableau 可讀取檔案。

進行連線並設定資料來源

  1. 啟動 Tableau,並在 [連線] 下選取 [統計檔案] ,選取要連線到的檔案,然後選取 [開啟]

  2. 在資料來源頁面上,執行下列操作:

    1. (可選)在頁面頂端選取預設資料來源名稱,然後輸入要在 Tableau 中使用的唯一資料來源名稱。舉例來說,使用可幫助其他資料來源使用者推斷出要連線的資料來源的資料來源命名約定。

    2. 選取工作表索引標籤以開始分析。

      有關連線到多個表的資訊,請參閱聯結資料

統計檔案資料來源範例

以下是在 Windows 電腦上使用 Tableau Desktop 的統計檔案資料來源的範例:

注意以下各項:

  • 統計檔案連接器不支援值標籤。

  • 統計檔案連接器只支援每個統計檔案一個表。

    如果出現錯誤訊息「與資料來源通訊時出錯」,請確保您的統計檔案只包含一個物件,並且該物件是資料框架或矩陣。R 檔案可能包含位於似乎是空白的工作區中的隱藏物件。若要檢查是否存在隱藏物件,請從 RStudio 中執行 ls(environment(), all.names=TRUE)

  • 您可以變更統計檔案的字元編碼。有關詳細資訊,請參閱變更統計檔案的字元編碼

R 資料檔案物件和格式支援

R 資料檔案應該只包含下列物件類型之一:

  • 二維矩陣

  • 向量

  • 因素

  • 資料幀

請注意,如果 R 資料檔案包含多個物件,則 Tableau 將連線到第一個物件。

Tableau 支援使用二進位格式的 R 資料檔案。

Tableau Desktop 中不支援 ASCII 格式的檔案。如果您嘗試使用帶有 ASCII 格式的 .rdata 或 .rda 檔案,您會看見一則錯誤訊息顯示 "Unable to read from file the table '' '[TableauTemp].[filename.rdata]' does not exist"(無法從檔案讀取資料表 '[TableauTemp].[filename.rdata]’ 不存在)。在這種情況下,可以使用 Rstudio 將檔案儲存為二進位格式,如下所示:

  1. 如果您沒有該檔案格式,請下載 RStudio。
  2. 在 Rstudio 中開啟 R 資料檔案。應該在右上方的全域環境視窗中看到您的資料物件。
  3. 使用「save()」函數將物件儲存到新檔案,如下所示:

    save(<objectName>,file="<filename>",ascii=FALSE)

    其中:<objectName> 為資料物件,<filename> 為新檔案的名稱,「FALSE」區分大小寫

    提示:要快速查看此函數的文件,請在命令提示字元中鍵入「?save」。

Tableau Desktop 中不支援壓縮的檔案。與 Tableau 連線之前,您必須使用諸如 Gzip 或 WinZip 之類的另一個程式解壓縮檔案。

變更統計檔案的字元編碼

Tableau 會根據檔案的字元編碼或輸入檔案中的資訊讀取統計檔案(例如,SAS 或 R 檔案)中的資料。R 檔案通常使用作業系統的字元編碼,相比之下,SAS 和 SPSS 檔案將字元編碼資訊包含在檔案中。有時候,您可能需要指定另一種編碼。例如,如果同事向您發送一個具有希臘語字元編碼的統計檔案,則您必須指定希臘語字元集,才能將該檔案與 Tableau 一起使用。如果從統計檔案讀取時需要使用不同的字元集,則可以建立 Tableau 資料來源自訂 (TDC) 檔案並指定要使用的編碼。

建立 TDC 檔案

.tdc 檔案是一個 XML 檔案,適用於單個資料來源,並且包含資料來源提供程式的供應商和驅動程式名稱資訊。對於統計檔案連接器,供應商和驅動程式名稱為 stat-direct

若要建立 TDC 檔案,請執行以下操作:

  1. 開啟純文字編輯器(例如記事本)。

  2. 複製以下提供的範例中的資訊,將其粘貼到文字檔中,然後指定 source-charset 值。(有關編碼的清單,請參閱統計檔連接器支援的使用者定義編碼。)

  3. 使用 .tdc 副檔名(例如 r-statsfile.tdc)將檔案儲存到 我的 Tableau 存放庫\Datasources 檔案夾中。

範例 TDC 檔案會設定 source-charset 值

以下 TDC 檔案範例將 source-charset 值設定為統計檔案資料來源的 shift-jis

<connection-customization class='stat-direct' enabled='true' version='10.0'>
<vendor name='stat-direct' />
<driver name='stat-direct' />
  <customizations>
    <customization name='source-charset' value='shift-jis' />
  </customizations>
</connection-customization>

重要資訊:TDC 檔案可用於自訂連線的功能或診斷和解決與連線資料相關的問題。Tableau 無法徹底測試可能對這些檔案進行的每項潛在修改。建立和使用 TDC 檔案需要手動編輯,並且在將它們部署到實際執行環境之前對其進行徹底測試至關重要。

關於 .ttde 和 .hhyper 檔案

在電腦的目錄中巡覽時,您可能會注意到 .ttde 或 .hhyper 檔案。當您建立連線至資料的 Tableau 資料來源時,Tableau 會建立 .ttde 或 .hhyper 檔案。此檔案(也稱為陰影擷取)用於幫助提高 Tableau Desktop 中的資料來源載入速度。儘管陰影擷取包含類似於標準 Tableau 擷取的基礎資料和其他資訊,但陰影擷取將以其他格式儲存,並且無法用於恢復資料。

附註:2024.2 之後的 Tableau 版本不再支援 .tde 檔案。所有擷取現在均為 .hyper 格式。

 

另請參閱