連線至資料

若要使用 Tableau Prep Builder 來清理和準備資料,就像在 Tableau Desktop 中一樣,請透過連線至資料來啟動一個新流程。您也可以開啟一個現有流程,並選取在何處停止。

您可以直接在開始頁面上查看和存取最近的流程,因此可以輕鬆地找到正在進行的工作。連線至資料之後,在輸入步驟中使用不同的選項來確定要在流程中處理的資料。然後新增清理步驟或其他步驟類型,以便檢查、清理和形成資料。

啟動或開啟流程

Tableau Prep Builder 支援連線到常用類型的資料以及 Tableau 資料擷取(.tde 或 .hyper)。在版本 2019.3.1 及更高版本中,您還可以連線到已發佈資料來源。

在版本 2020.2.2 及更高版本中,除了已發佈資料來源外,如果已您的 Tableau Catalo 已經啟用資料管理附加元件,即可搜尋並連接至 Tableau Server 或 Tableau Online 上儲存的資料庫、檔案和資料表。有關 Tableau Catalog 的詳情,請參閱 Tableau ServerTableau Online 說明中的「關於 Tableau Catalog」。

您的 Tableau Prep Builder 版本可能還不支援那些 Tableau Desktop 支援的連接器。不過,每個新版本都會增加新連接器,因此請檢查「連線」窗格以確定連接器是否可用。

附註:如果在連線器不受支援的版本中開啟流程,流程可能會開啟,但是,除非移除了資料連線,否則流程可能會出現錯誤或無法執行。

也可以像在 Tableau Desktop 中一樣使用自訂 SQL 查詢來連線至資料。有關詳情,請參閱 Tableau Desktop 和 Web 製作說明中的連線到自訂 SQL 查詢

若要檢查您是否能連線到資料,請開啟 Tableau Prep Builder,並按一下「新增連線」 按鈕,確定您的資料是否列在左側窗格中的「連線」下。

某些連線器可能會要求您下載並安裝驅動程式,然後才能連線至資料。請參閱 Tableau 網站上的驅動程式下載頁面獲取驅動程式下載連結以及安裝說明。

從版本 2020.1.1 開始,還可以輕鬆查看哪些連線器和資料表與您的輸入步驟相關聯。按一下「輸入」步驟後,關聯的連線器和資料表將反白顯示在「連線」窗格中。

開始新流程

  1. 開啟 Tableau Prep Builder 並按一下 [新增連線] 按鈕。

  2. 從連線器清單中,選取檔案類型或託管您的資料的伺服器。如果出現提示,請輸入所需的資訊以登錄並存取資料。

  3. 「連線」窗格中,執行以下操作之一:

    • 如果連線到檔案,請按兩下表或將表拖到「流程」窗格以開始流程。對於單一表,Tableau Prep Builder 會在您將資料新增到流程時,自動為您在「流程」窗格中建立「輸入」步驟。

    • 如果連線至資料庫,請選取資料庫或架構,然後按兩下資料表,或將資料表拖曳到「流程」窗格以開始流程。

      附註:如果您從單一資料來源連線到多個檔案或資料庫表格,您可以使用萬用字元搜尋,並在輸入步驟中聯集檔案或表格。有關詳情,請參閱輸入步驟中的聯集檔案和資料庫資料表

開啟現有流程

若要開啟現有流程,請在「開始」頁面上執行下列其中一項動作:

  • 「最近的流程」下,選取一個流程。

  • 按一下「開啟流程」,巡覽到流程檔並將其開啟。

按一下「檔案」>「新增」「檔案」>「開啟」以開啟新的工作區。如果您想同時處理多個流程,可以使用這些選項開啟多個 Tableau Prep Builder 工作區。在 Tableau Prep Builder 2019.3.1 版及更早版本中,若您選取「檔案」>「開啟」Tableau Prep Builder 會以您選取的新流程取代目前開啟的流程。

連線到發布的資料來源(版本 2019.3.1 及更新版本)

如果您將資料從 Tableau Desktop 發布至 Tableau ServerTableau Online,或作為流程的輸出,您可以連線至發布的資料來源,並使用這些資料來源作為流程的輸入資料來源。

附註:發布的流程若包含發行資料來源這種輸入時,發行者會被指派為預設流程擁有者。流量執行時,會將流程擁有者當作「執行身分」帳戶。如需執行身分帳戶的詳情,請參閱執行身分服務帳戶。只有網站或伺服器管理員可以變更 Tableau OnlineTableau Server 中的流程擁有者。

使用此功能時,會套用以下要求:

  • 完全支援連線至 Tableau Server版本 2019.3 及更高版本可用的已發佈資料來源。如果連線至較早版本 Tableau Server 的發布資料來源,可能無法使用所有功能。
  • 您必須在已登入的 Tableau Server 站點中,獲指派 Explorer 或更高級別的角色,才能連線到發布的資料來源。有關站點角色的詳情,請參閱 Tableau Server 說明中的設定使用者站點角色
  • 必須內嵌認證才能連線至已發布的資料來源。如果資料來源未內嵌認證,請更新資料來源以包含內嵌認證。
  • 目前不支援包含多維(多維資料集)資料或包含使用者篩選條件的發布資料來源。
  • 不支援多個伺服器連線。您必須使用相同伺服器或站點連線,才能執行以下操作:
    • 連線到發布的資料來源。
    • 將流程輸出發布至 Tableau ServerTableau Online
    • 將流程排程在 Tableau ServerTableau Online 上執行。

要連線到已發佈資料來源,請按照以下 Tableau Prep Builder 版本的說明操作:

版本 2020.2.1 及更早版本
  1. 開啟 Tableau Prep Builder,並按一下「新增連線」按鈕。

  2. 在連接器清單中,選取「Tableau Server」

  3. 登入以連線至您的伺服器或站點。

  4. 選取您的資料來源,或使用搜尋選項以尋找您的資料來源,並將其拖曳至流程窗格以開始流程。「輸入」窗格中的「Tableau Server」索引標籤顯示已發布資料來源的詳細資訊。

版本 2020.2.2 及更高版本

可以直接從「連線」窗格連線至已發佈資料來源以及儲存在 Tableau Server 或 Tableau Online 上的更多資料來源。如果 Tableau Catalog 已經啟用資料管理附加元件,還可以搜尋和連線到資料庫和資料表,並檢視或篩選資料來源相關的中繼資料,如:說明、資料品質警告和認證。

有關 Tableau Catalog 的詳情,請參閱 Tableau ServerTableau Online 說明中的「關於 Tableau Catalog」。

  1. 開啟 Tableau Prep Builder,並按一下「新增連線」按鈕。
  2. 「連線」窗格的「搜尋資料」下方,選擇 Tableau Server

  3. 登入以連線至您的伺服器或站點。

  4. 「搜尋資料」對話框中,使用可用的已發佈資料來源清單搜尋。使用篩選器選項,依連線類型和經過認證的資料來源進行篩選。

  5. 選取要使用的資料來源,然後按一下「連線」

    如果沒有連線到資料來源的權限,則列和「連線」按鈕會顯示為灰色。

    附註:如果 Tableau Catalog 並未啟用資料管理附加元件,「內容類型」下拉清單就不會顯示。清單中僅顯示已發佈資料來源。

  6. 資料來源已新增至「流程」窗格。在「連線」窗隔中選取額外的資料來源,或使用搜尋選項以尋找您的資料來源,並將其拖曳至流程窗格以建立流程。「輸入」窗格中的「Tableau Server」索引標籤顯示已發布資料來源的詳細資訊。

  7. (選用)如果 Tableau Catalog 已啟用資料管理附加元件,請使用「內容類型」下拉清單來搜尋資料庫和資料表。

    可以使用右上角的篩選器選項,依連線類型、資料品質警告和認證篩選結果。

連線到雲端資料來源。

您可以在 Tableau Prep Builder 中連線至雲端資料來源,就像 Tableau Desktop 一樣,但如果您打算發布連線至雲端資料來源的流程,並在伺服器上排程執行這些流程,您需要在 Tableau ServerTableau Online 中設定憑證。

您可以在「我的帳戶設定」頁面中的「設定」索引標籤設定認證,然後使用該認證連線至雲端連接器輸入。發佈流程時,請在「發佈」對話方塊中按一下「編輯」以編輯連線,然後在「驗證」下拉式清單中選取「內嵌」 <您的憑證>。

從版本 2020.1.1 開始,您可以在發佈流程時,直接從發佈對話方塊新增認證,然後在發佈時將它們自動內嵌於流程。有關詳情,請參閱發佈流程

如果您沒有儲存的憑證,請設定並選取「驗證」下拉式清單中的「提示使用者」,而發佈流程後,您必須編輯連線,並在 Tableau ServerTableau Online「連線」索引標籤中輸入憑證,否則執行時流程將會失敗。

Tableau Prep Builder 2019.4.1 版本中,已新增下列雲端連接器:

  • Box
  • DropBox
  • Google Drive
  • OneDrive

有關如何使用這些連接器連線至資料的詳情,請參閱 Tableau Desktop 說明中的特定連接器

連線到 Salesforce 資料(版本 2020.2.1 及更高版本)

和 Tableau Desktop 一樣,Tableau Prep Builder 支援使用 Salesforce 連接器連線至資料,但略有不同。

  • Tableau Prep Builder 支援要執行的任何聯結類型。
  • 目前不支援自訂 SOQL。
  • 目前不支援使用標準連接建立自己的自訂連接。
  • 不能將預設資料來源名稱變更為唯一或自訂的名稱。
  • 如果計劃將流程發佈到 Tableau Server,並希望使用已儲存的認證,則伺服器管理員將需要使用 OAuth 用戶端 ID 和連接器上的密碼設定 Tableau Server。有關詳情,請參閱 Tableau Server 説明中的將 Salesforce.com OAuth 變更為已儲存認證

Tableau Prep Builder 透過建立擷取來匯入資料。Salesforce 目前僅支援擷取。視包含的資料量而定,初始擷取可能需要一些時間。在載入資料時,會在「輸入」步驟中看到計時器。

有關使用 Salesforce 連接器的一般資訊,請參閱 Tableau Desktop 和 Web 製作說明中的 Salesforce

連線到 Google BigQuery(2019.3.1 版更新版本)

和 Tableau Desktop 一樣,Tableau Prep Builder 支援使用 Google BigQuery 連線至資料。您必須設定 OAuth 認證,Tableau Prep Builder 才能與 Google BigQuery 通訊。如果您打算將流程發布至 Tableau ServerTableau Online,則也必須為這些應用程式設定 OAuth 連線。

附註Tableau Prep Builder 目前不支援使用 Google BigQuery 自訂屬性。

如果您在 Mac 上使用 Tableau Prep Builder,且正在使用 proxy 連線至 Big Query,則可能需要修改 SSL 組態以連線至 Google BigQuery

設定 SSL 以連線至 Google BigQuery(僅限 MacOS)

附註:Windows 使用者不需要執行額外步驟。

如果要設定 SSL 以讓 OAuth 連線至 Google BigQuery,請完成以下步驟:

  1. 將 proxy 的 SSL 認證匯出為檔案,例如 proxy.cer。您可以在 Applications > Utilities > Keychain Access >System > Certificates (under Category) 中找到您的認證。
  2. 找到用來執行 Tableau Prep Builder 的 java 版本。例如:/Applications/Tableau Prep Builder 2020.1.app/Plugins/jre/lib/security/cacerts

  3. 開啟終端命令提示字元,為您的 Tableau Prep Builder 版本執行下列命令:

    附註:keytool 命令必須在包含用來執行 Tableau Prep Builder 的 java 版本的目錄中執行。執行此命令之前,您可能需要變更目錄。例如 cd /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder 2020.1.1/Plugins/jre/bin。然後執行 keytool 命令。

    keytool –import –trustcacerts –file /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder <version>/Plugins/jre/lib/security/cacerts -storepass changeit

    範例 keytool –import –trustcacerts –file /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder 2020.1.1/Plugins/jre/lib/security/cacerts -storepass changeit

如果在執行 keytool 命令時收到 FileNotFoundException(存取被拒),請嘗試使用較高的權限執行該命令。例如:sudo keytool –import –trustcacerts –file /Users/tableau_user/Desktop/SSL.cer -keystore Tableau Prep Builder 2020.1.1/Plugins/jre/lib/security/cacerts -storepass changeit

設定和管理您的 Google BigQuery 認證

在「輸入」步驟中連線到 Google BigQuery 所使用的認證必須符合在 Tableau ServerTableau Online 中為 Google BigQuery 於「我的帳戶設定」頁面之「設定」索引標籤中設定的認證。

發佈流程時,如果您選取不同的認證,或在驗證設定中沒有認證,流程將失敗,並顯示驗證錯誤,直到您在 Tableau Server 或 Tableau Online 中編輯該流程的連線。

若要編輯認證,請執行下列動作:

  1. Tableau ServerTableau Online 中,在「連線」索引標籤中的 Google BigQuery 連線,按一下「更多動作」
  2. 選取「編輯連線」
  3. 選取在「我的帳戶設定」頁面之「設定」索引標籤中設定的已儲存認證。

有關設定及管理憑證的詳情,請參閱以下主題:

Tableau Desktop 和 Web 製作說明中的管理您的帳戶設定

有關發佈流程時設定驗證選項的詳情,請參閱發佈流程

有關在 Tableau ServerTableau Online 中解決連線問題的詳情,請參閱檢視並解決錯誤

連線至 SAP HANA(版本 2019.2.1 及更新版本)

和 Tableau Desktop 一樣,Tableau Prep Builder 支援使用 SAP HANA 連線至資料,但稍有差別。使用與 Tableau Desktop 中相同的步驟連線至資料庫。有關詳細資訊,請參閱 SAP HANA。連線後搜尋您的資料表,將資料表拖曳到畫布以開始組建流程。

Tableau Prep Builder 不支援在開啟流程時提示變數和參數。而是在「輸入」窗格中,按一下「變數和參數」索引標籤,然後選取要使用的變數和運算元,然後從預設值清單進行選取或輸入自訂值以查詢資料庫並傳回所需的值。

注意:自 Tableau Prep Builder 版本 2019.2.2 開始,您可以使用 Initial SQL 查詢連接;若有多個變數值,您可以從下拉式清單中選取需要的值。

您也可以新增其他變數。按一下「變數」部份的加號按鈕 ,選取變數和運算元,然後輸入自訂值。

附註:Tableau Prep Conductor 2019.1 版本中不支援此連接器。如果您建立使用此連接器的流程,您可以發佈該流程,但無法使用 Tableau Server 中的排程功能執行該流程。您可以改為使用命令列介面執行該流程以使您的資料保持最新。有關從透過命令列執行流程的詳情,請參閱透過命令列重新整理輸出檔案有關版本相容性的詳情,請參閱Tableau Prep 版本相容性

使用 ODBC 連線(版本 2019.2.2 及更新版本)

如需連線至「連線」窗格中未列出的資料來源,您可以使用支援 SQL 的「其他資料庫 (ODBC)」連接器來連線至任何資料來源,並實作 ODBC API。藉由「其他資料庫 (ODBC)」連接器採用與在 Tableau Desktop 中所使用的類似方式來連接資料,不過方式有一些差異:

  • 您只能使用「DSN(資料來源名稱)」選項連線。

  • 若要在 Tableau Server 中發佈及執行流程,必須使用相符的 DSN 來設定伺服器。

    附註:從命令列 (Tableau Prep Builder) 執行的流程,其中包含目前不支援的「其他資料庫 (ODBC)」連接器。

  • 提供適用於 Windows 和 MacOS 的單一連接體驗。不支援為 ODBC 驅動程式 (Windows) 提示連線屬性。

  • Tableau Prep Builder 僅支援64位元驅動程式。

連線前

若要使用「其他資料庫 (ODBC)」連接器,您必須安裝資料庫驅動程式,並設定和配置 DSN(資料來源名稱)。若要在 Tableau Server 中發佈及執行流程,必須也使用相符的 DSN 來設定伺服器。

重要:Tableau Prep Builder 僅支援 64 位元驅動程式。若您已經設定和配置 32 位元驅動程式,則可能需要將其解除安裝,而且如果驅動程式不允許同時安裝兩種版本,就需要安裝 64 位元版本。

  1. 使用 ODBC 資料來源管理員(64位元) (Windows) 或 ODBC Manager 公用程式 (MacOS) 來建立DSN。

    若您並未在 Mac 上安裝公用程式,便可以從某個網址(例如,www.odbcmanager.net)下載一個公用程式,或手動編輯 odbc.ini 檔案。

  2. ODBC 資料來源管理員(64位元)(Windows) 或 ODBC Manager 公用程式 (MacOS) 中,新增資料來源,然後選取資料來源的驅動程式,再按一下「完成」

  3. 「ODBC 驅動程式設定」對話方塊中,輸入設定資訊,例如伺服器名稱、連接埠、使用者名稱和密碼。如果對話方塊有選項,請按一下「測試」以確認連接已正確設定,然後儲存您的設定。

    注意:Tableau Prep Builder 不支援提示輸入連接屬性,因此您必須在設定 DNS 時設定此資訊。

    此範例顯示 MySQL Connector 的設定對話方塊。

使用其他資料庫 (ODBC) 連接

  1. 開啟 Tableau Prep Builder,並按一下「新增連線」按鈕。

  2. 在連接器清單中,選取「其他資料庫 (ODBC)」

  3. 「其他資料庫 (ODBC)」對話方塊中,從下拉式清單中選取 DSN,然後輸入使用者名稱和密碼。接著按一下「登入」

  4. 「連線」窗格中,從下拉式清單中選取您的資料庫。

使用 Initial SQL 查詢您的連線(版本 2019.2.2 及更新版本)

您可以指定 Initial SQL 命令,在連線至支援的資料庫時執行。例如,連接至 Amazon Redshift 時,您可以輸入SQL 陳述式,以便在連接至資料庫時套用篩選器,如同在「輸入」步驟中新增篩選器一樣。SQL 命令會在資料採樣和載入至 Tableau Prep Builder 之前套用。

從版本 2020.1.3 開始,您也可以包含參數以傳遞應用程式名稱、版本和流程名稱資料,以便在您查詢資料來源時包含追蹤資料。

執行 Initial SQL

若要重新整理資料並執行 Initial SQL 命令,請執行下列其中一項動作:

•重新建立連線以變更 Initial SQL 命令,並重新整理「輸入」步驟。

• 執行流程。Initial SQL 命令會在處理所有資料之前執行。

• 將流程排程在 Tableau Server 或 Tableau Online 上執行。每次執行流程時,都會執行 Initial SQL 做為資料載入體驗的一部分。

附註:需要「資料管理附加元件」才能在 Tableau ServerTableau Online 上執行流程。有關 資料管理附加元件 的詳情,請參閱使用資料管理附加元件

  1. 在「連線」窗格中,選取支援 Initial SQL 之清單中的連接器。
  2. 按一下「顯示 Initial SQL」連結以展開對話方塊,並輸入 SQL 陳述式。

在 Initial SQL 陳述式中包含參數(版本 2020.1.3 及更新版本)

重要資訊:Tableau Prep Builder 版本 2020.2.1 及更早版本中的 Initial SQL 不支援參數。如果您嘗試輸入參數,如同在 Tableau Desktop 一樣,就會收到錯誤訊息。

您可以將以下參數傳遞到資料來源,以新增有關您 Tableau Prep 應用程式、版本及流程名稱等其他詳情。TableauServerUserTableauServerUserFull 參數目前不受支援。

參數 說明 傳回的值
TableauApp 用來存取資料來源的應用程式。

Prep Builder

Prep Conductor

TableauVersion 應用程式版本號碼。

Tableau Prep Builder:傳回確切的版本資訊。例如,2020.1.3

Tableau Prep Conductor:傳回已啟用 Tableau Prep Conductor 的主要伺服器版本。例如,2020.1

FlowName Tableau Prep Builder 中的 .tfl 檔案名稱 範例:Entertainment Data_Cleaned

連線到 Tableau 資料擷取

連線到 Tableau 資料擷取時,Tableau Prep Builder 將解包擷取,並且 hyper 將擴展,從而會在將流程操作應用於產生的原始資料時使用很多臨時空間。

這意味著您需要更多的 RAM 和磁碟空間來容納該大小的檔案。例如,包含 18 欄和 1200 萬列、大小為 360MB(解壓縮後為 8.5 GB)的擷取檔案可能最多需要 32GB RAM、16 核和 500GB 可用磁碟空間才能在檔案解壓縮後支援該檔案。

使用 Data Interpreter 清理您的檔案

處理 Microsoft Excel 檔案時,您可以使用 Data Interpreter 來檢測資料中的子表,以及移除無關資訊來說明準備資料進行分析。開啟 Data Interpreter 時,它將檢測這些子表,並將其列為「連線」窗格的「表」部分中的新表。

然後,您可以將它們拖到「流程」窗格中。如果使用 Tableau Prep Builder 版本 2018.1.2 或更新版本,您可以在「多個檔案」索引標籤中選取「萬用字元聯集」選項,以在流程中包括所有找到的子表。有關在「輸入」步驟中使用萬用字元聯集的詳情,請參閱輸入步驟中的聯集檔案和資料庫資料表

如果關閉 Data Interpreter,則會從「連線」窗格中移除這些表格。如果已在流程中使用了這些表,則會由於缺少資料而導致流程錯誤。

注意:目前,Data Interpreter 只會偵測 Excel 試算表中的子表,並不支援指定文字檔和試算表的起始列。

下面的範例顯示在「連線」窗格中對 Excel 試算表使用 Data Interpreter 的結果。Data Interpreter 檢測到兩個額外的子表。

使用 Data Interpreter 之前 使用 Data Interpreter 之後

若要使用 Data Interpreter,請完成以下步驟:

  1. 選取「連線至資料」,然後選取「Microsoft Excel」

  2. 選取您的檔案,並按一下「開啟」

  3. 選中「使用 Data Interpreter」核取方塊。

  4. 將新表拖到「流程」窗格以將其包括在流程中。若要移除舊表,請以滑鼠右鍵按一下舊表的輸入步驟,並選取「移除」

此區段的其他文章

感謝您的回饋! 提交意見回饋時發生錯誤。重試或傳送訊息給我們