連線到資料

若要使用 Tableau Prep Builder 來清理和準備資料,就像在 Tableau Desktop 中一樣,請透過連線到資料來啟動一個新流程。您也可以開啟一個現有流程,並選取在何處停止。

您可以直接在開始頁面上查看和存取最近的流程,因此可以輕鬆地找到正在進行的工作。連線到資料之後,在輸入步驟中使用不同的選項來確定要在流程中處理的資料。

啟動或開啟流程

Tableau Prep Builder 支援連線到常用類型的資料,以及 Tableau 資料擷取(.tde 或 .hyper),並自版本 2019.3.1 起,發布資料來源。您的 Tableau Prep Builder 版本可能還不支援那些 Tableau Desktop 支援的連接器。不過,每個新版本都會增加新連接器,因此請檢查「連線」窗格以確定連接器是否可用。

附註:如果在連線器不受支援的版本中開啟流程,流程可能會開啟,但是,除非移除了資料連線,否則流程可能會出現錯誤或無法執行。

您也可以使用自訂 SQL 查詢來連線到資料,就像您目前可在 Tableau Desktop 中所做的一樣。有關詳情,請參閱 Tableau Desktop 和 Web 製作說明中的連線到自訂 SQL 查詢

若要檢查您是否能連線到資料,請開啟 Tableau Prep Builder,並按一下「新增連線」 按鈕,確定您的資料是否列在「連線」下的左側窗格中。

附註:某些連線器可能會要求您下載並安裝驅動程式,然後才能連線到資料。請參閱 Tableau 網站上的驅動程式下載頁面獲取驅動程式下載連結以及安裝說明。

開始新流程

  1. 開啟 Tableau Prep Builder,並按一下「新增連線」 按鈕。

  2. 從連線器清單中,選取檔案類型或託管您的資料的伺服器。如果出現提示,請輸入所需的資訊以登錄並存取資料。

  3. 「連線」窗格中,執行以下操作之一:

    • 如果連線到檔案,請按兩下表或將表拖到「流程」窗格以開始流程。

      對於單一表格,Tableau Prep Builder 會在您將資料新增到流程時,自動為您在「流程」窗格中建立輸入步驟。

    • 如果連線到資料庫,請選取資料庫或架構,然後按兩下表格,或將表格拖曳到「流程」窗格以開始流程。

      附註:如果您從單一資料來源連線到多個檔案或資料庫表格,您可以使用萬用字元搜尋,並在輸入步驟中聯集檔案或表格。有關詳情,請參閱輸入步驟中的聯集檔案和資料庫資料表

開啟現有流程

若要開啟現有流程,請在「開始」頁面上執行以下操作之一:

  • 「最近的流程」下,選取一個流程。

  • 按一下「開啟流程」,巡覽到流程檔並將其開啟。

按一下「檔案」>「新增」「檔案」>「開啟」以開啟新的工作區。如果您想同時處理多個流程,可以使用這些選項開啟多個 Tableau Prep Builder 工作區。在 Tableau Prep Builder 2019.3.1 版及更早版本中,若您選取「檔案」>「開啟」Tableau Prep Builder 會以您選取的新流程取代目前開啟的流程。

連線到發布的資料來源(版本 2019.3.1 及更新版本)

如果您將資料從 Tableau Desktop 發布至 Tableau ServerTableau Online,或作為流程的輸出,您可以連線至發布的資料來源,並使用這些資料來源作為流程的輸入資料來源。

附註:發布的流程若包含發行資料來源這種輸入時,發行者會被指派為預設流程擁有者。流量執行時,會將流程擁有者當作「執行身分」帳戶。如需執行身分帳戶的詳情,請參閱執行身分服務帳戶。只有網站或伺服器管理員可以變更 Tableau OnlineTableau Server 中的流程擁有者。

使用此功能時,會套用以下要求:

  • 完全支援連線至 Tableau Server 2019.3 版可用的發布資料來源。如果連線至較早版本 Tableau Server 的發布資料來源,可能無法使用所有功能。
  • 您必須在已登入的 Tableau Server 站點中,獲指派 Explorer 或更高級別的角色,才能連線到發布的資料來源。有關站點角色的詳情,請參閱 Tableau Server 說明中的設定使用者站點角色
  • 目前不支援包含多維(多維資料集)資料或包含使用者篩選條件的發布資料來源。
  • 不支援多個伺服器連線。您必須使用相同伺服器或站點連線,才能執行以下操作:
    • 連線到發布的資料來源。
    • 將流程輸出發布至 Tableau ServerTableau Online
    • 將流程排程在 Tableau ServerTableau Online 上執行。

若要連線至已發布的資料來源,請執行以下操作:

  1. 開啟 Tableau Prep Builder,並按一下「新增連線」 按鈕。

  2. 在連接器清單中,選取「Tableau Server」

  3. 登入以連線至您的伺服器或站點。

  4. 選取您的資料來源,或使用搜尋選項以尋找您的資料來源,並將其拖曳至流程窗格以開始流程。「輸入」窗格中的「Tableau Server」索引標籤顯示已發布資料來源的詳細資訊。

連線到 Google BigQuery(2019.3.1 版更新版本)

和 Tableau Desktop 一樣,Tableau Prep Builder 支援使用 Google BigQuery 連線到資料。您必須設定 Oauth 認證, Tableau Prep Builder 才能與 Google BigQuery 通訊。如果您打算將流程發布至 Tableau ServerTableau Online,必須也為這些應用程式設定 Oauth 連線。

附註Tableau Prep Builder 目前不支援使用 Google BigQuery 自訂屬性。

在「輸入」步驟中連線到 Google BigQuery 所使用的認證必須符合在 Tableau ServerTableau Online 中為 Google BigQuery 於「我的帳戶設定」頁面之「設定」索引標籤中設定的認證。

發布流程時,如果您選取不同的認證,或在驗證設定中沒有認證,流程將失敗,並顯示驗證錯誤,直到您在 Tableau Server 或 Tableau Online 中編輯該流程的連線。

若要編輯認證,請執行以下操作:

  1. Tableau ServerTableau Online 中,在「連線」索引標籤中的 Google BigQuery 連線,按一下「更多動作」
  2. 選取「編輯連線」
  3. 選取在「我的帳戶設定」頁面之「設定」索引標籤中設定的已儲存認證。

有關詳情,請參閱 Tableau Desktop 和 Web 製作說明中的管理您的帳戶設定。有關發布流程時設定驗證的詳情,請參閱發佈流程

連線至 SAP HANA(版本 2019.2.1 及更新版本)

和 Tableau Desktop 一樣,Tableau Prep Builder 支援使用 SAP HANA 連線到資料,但稍有差別。使用與 Tableau Desktop 中相同的步驟連線到資料庫。有關詳細資訊,請參閱 SAP HANA。連線後搜尋您的資料表,將資料表拖曳到畫布以開始組建流程。

Tableau Prep Builder 不支援在開啟流程時提示變數和參數。而是在「輸入」窗格中,按一下「變數和參數」索引標籤,然後選取要使用的變數和運算元,然後從預設值清單進行選取或輸入自訂值以查詢資料庫並傳回所需的值。

注意:自 Tableau Prep Builder 版本 2019.2.2 開始,您可以使用 Initial SQL 查詢連接;若有多個變數值,您可以從下拉式清單中選取需要的值。

您也可以新增其他變數。按一下「變數」部份的加號按鈕 ,選取變數和運算元,然後輸入自訂值。

附註:Tableau Prep Conductor 2019.1 版本中不支援此連接器。如果您建立使用此連接器的流程,您可以發佈該流程,但無法使用 Tableau Server 中的排程功能執行該流程。您可以改為使用命令列介面執行該流程以使您的資料保持最新。有關從透過命令列執行流程的詳情,請參閱透過命令列重新整理輸出檔案有關版本相容性的詳情,請參閱Tableau Prep 版本相容性

使用 ODBC 連線(版本 2019.2.2 及更新版本)

如需連線至「連接」窗格中未列出的資料來源,您可以使用支援 SQL 的「其他資料庫 (ODBC)」連接器來連線至任何資料來源,並實作 ODBC API。藉由「其他資料庫 (ODBC)」採用與在 Tableau Desktop 中所使用的類似方式來連接資料,但有一些差異:

  • 您只能使用「DSN(資料來源名稱)」選項連線。

  • 若要在 Tableau Server 中發佈及執行流程,必須使用相符的 DSN 來設定伺服器。

    附註:從命令列 (Tableau Prep Builder) 執行的流程,其中包含目前不支援的「其他資料庫 (ODBC)」連接器。

  • 提供適用於 Windows 和 MacOS 的單一連接體驗。不支援為 ODBC 驅動程式 (Windows) 提示連線屬性。

  • Tableau Prep Builder 僅支援64位元驅動程式。

連線前

若要使用「其他資料庫 (ODBC)」連接器,您必須安裝資料庫驅動程式,並設定和配置 DSN(資料來源名稱)。若要在 Tableau Server 中發佈及執行流程,必須也使用相符的 DSN 來設定伺服器。

重要:Tableau Prep Builder 僅支援 64 位元驅動程式。若您已經設定和配置 32 位元驅動程式,則可能需要將其解除安裝,而且如果驅動程式不允許同時安裝兩種版本,就需要安裝 64 位元版本。

  1. 使用 ODBC 資料來源管理員(64位元) (Windows) 或 ODBC Manager 公用程式 (MacOS) 來建立DSN。

    若您並未在 Mac 上安裝公用程式,便可以從某個網址(例如,www.odbcmanager.net)下載一個公用程式,或手動編輯 odbc.ini 檔案。

  2. ODBC 資料來源管理員(64位元)(Windows) 或 ODBC Manager 公用程式 (MacOS) 中,新增資料來源,然後選取資料來源的驅動程式,再按一下「完成」

  3. 「ODBC 驅動程式設定」對話方塊中,輸入設定資訊,例如伺服器名稱、連接埠、使用者名稱和密碼。如果對話方塊有選項,請按一下「測試」以確認連接已正確設定,然後儲存您的設定。

    注意:Tableau Prep Builder 不支援提示輸入連接屬性,因此您必須在設定 DNS 時設定此資訊。

    此範例顯示 MySQL Connector 的設定對話方塊。

使用其他資料庫 (ODBC) 連接

  1. 開啟 Tableau Prep Builder,並按一下「新增連線」 按鈕。

  2. 在連接器清單中,選取「其他資料庫 (ODBC)」

  3. 「其他資料庫 (ODBC)」對話方塊中,從下拉式清單中選取 DSN,然後輸入使用者名稱和密碼。接著按一下「登入」

  4. 「連線」窗格中,從下拉式清單中選取您的資料庫。

使用 Initial SQL 查詢您的連線(版本 2019.2.2 及更新版本)

您可以指定 Initial SQL 命令,在連接至支援的資料庫時,會在資料庫的連接建立時執行。例如,連接至 Amazon Redshift 時,您可以輸入SQL 陳述式,以便在連接至資料庫時套用篩選器,如同在「輸入」步驟中新增篩選器一樣。SQL 命令會在資料採樣和載入至 Tableau Prep Builder 之前套用。

若要重新整理資料並再次執行 Initial SQL 命令,請執行下列其中一項作業:

•重新建立連線以變更 Initial SQL 命令,並重新整理「輸入」步驟。

• 執行流程。Initial SQL 命令會在處理所有資料之前執行。

• 將流程排程在 Tableau Server 上執行。每次執行流程時,都會執行 Initial SQL 做為資料載入體驗的一部分。

  1. 在「連接」窗格中,選取支援 Initial SQL 之清單中的連接器。
  2. 按一下「顯示 Initial SQL」連結以展開對話方塊,並輸入 SQL 陳述式。

重要:Tableau Prep Builder 中的 Initial SQL 不支援參數。如果您嘗試輸入參數,如同在 Tableau Desktop 一樣,就會收到錯誤訊息。

連線到 Tableau 資料擷取

連線到 Tableau 資料擷取時,Tableau Prep Builder 將解包擷取,並且 hyper 將擴展,從而會在將流程操作應用於產生的原始資料時使用很多臨時空間。

這意味著您需要更多的 RAM 和磁碟空間來容納該大小的檔案。例如,包含 18 欄和 1200 萬列、大小為 360MB(解壓縮後為 8.5 GB)的擷取檔案可能最多需要 32GB RAM、16 核和 500GB 可用磁碟空間才能在檔案解壓縮後支援該檔案。

使用 Data Interpreter 清理您的檔案

處理 Microsoft Excel 檔案時,您可以使用 Data Interpreter 來檢測資料中的子表,以及移除無關資訊來說明準備資料進行分析。開啟 Data Interpreter 時,它將檢測這些子表,並將其列為「連線」窗格的「表」部分中的新表。

然後,您可以將它們拖到「流程」窗格中。如果使用 Tableau Prep Builder 版本 2018.1.2 或更新版本,您可以在「多個檔案」索引標籤中選取「萬用字元聯集」選項,以在流程中包括所有找到的子表。有關在「輸入」步驟中使用萬用字元聯集的詳情,請參閱輸入步驟中的聯集檔案和資料庫資料表

如果關閉 Data Interpreter,則會從「連線」窗格中移除這些表格。如果已在流程中使用了這些表,則會由於缺少資料而導致流程錯誤。

注意:目前,Data Interpreter 只會偵測 Excel 試算表中的子表,並不支援指定文字檔和試算表的起始列。

下面的範例顯示在「連線」窗格中對 Excel 試算表使用 Data Interpreter 的結果。Data Interpreter 檢測到兩個額外的子表。

使用 Data Interpreter 之前 使用 Data Interpreter 之後

若要使用 Data Interpreter,請完成以下步驟:

  1. 選取「連線到資料」,然後選取「Microsoft Excel」

  2. 選取您的檔案,並按一下「開啟」

  3. 選中「使用 Data Interpreter」核取方塊。

  4. 將新表拖到「流程」窗格以將其包括在流程中。若要移除舊表,請以滑鼠右鍵按一下舊表的輸入步驟,並選取「移除」

感謝您的回饋! 提交意見回饋時發生錯誤。重試或傳送訊息給我們