在輸入步驟中新增更多資料

連線至資料來源並開始建立流程後,您可能需要在新資料傳入時重新整理資料連線。您也可以加入或聯集輸入步驟中的資料集合,以提升處理更多資料來源的效率。

在「輸入」步驟中重新整理資料

如果開始處理流程後輸入檔案或表格中的資料發生變化,您可以重新整理「輸入」步驟為引入新資料。

檔案輸入步驟類型

若要重新整理檔案輸入步驟,請執行下列其中一項動作:

  • 在流程窗格中的頂端功能表上,按一下「重新整理」按鈕以重新整理所有「輸入」步驟。若要重新整理單個「輸入」步驟,請按一下重新整理按鈕旁邊的下拉箭頭,並從清單中選取該「輸入」步驟。

  • 在流程窗格中,以滑鼠右鍵按一下要重新整理的「輸入」步驟,並從功能表中選取「重新整理」

檔案、資料庫或 Tableau 擷取輸入步驟類型

若要重新整理資料庫或 Tableau 擷取輸入步驟,請執行下列其中一項動作:

  • 嘗試編輯連線。

    附註:為維護效能,Tableau Prep Builder 會抽樣大型資料集合。如果您的資料已抽樣,您可能會在設定檔窗格中看到您的新資料。您可以在「輸入步驟」的「資料樣本」索引標籤中變更資料抽樣方式的設定,但這可能會影響效能。有關設定資料樣本大小的詳細資訊,請參閱選取資料樣本大小

    1. 「連線」窗格中,按一下滑鼠右鍵,或按住 Ctrl 並按一下 (MacOS) 資料來源,然後選取「編輯」

    2. 登入資料庫或重新選取檔案或 Tableau 擷取,以重新建立您的連線。

  • 移除「輸入」步驟並將其重新新增到流程。

    1. 在流程窗格中,以滑鼠右鍵按一下要重新整理的「輸入」步驟,並從功能表中選取「移除」

      這會使您的流程暫時處於錯誤狀態。

    2. 再次連線到更新的檔案。

    3. 將表格拖到流程窗格中要向其中新增「輸入」步驟的流程中的第二個步驟上。將其放在「新增」選項上,以將其重新連線到流程。

輸入步驟中的聯集檔案和資料庫資料表

使用來自單一資料來源的多個檔案或資料庫表格時,您可以使用萬用字元搜尋來搜尋檔案或表格,然後聯集以將所有檔案或表格資料包含在「輸入」步驟中。若要聯集檔案,檔必須位於同一父目錄或子目錄中。

下次開啟流程或透過命令列執行流程時,會在聯集中自動加入新增至同一資料夾,且與該模式相符的新檔案。封裝的流程檔案(.tflx)不會自動挑選新檔案,因為檔案已與流程封裝在一起。若要納入封裝流程的新檔案,請開啟流程檔(.tfl)以挑選新檔案,然後重新封裝流程將新檔案資料納入其中。

若要聯集資料庫表格,表格必須位於同一資料庫中,並且資料庫連線必須支援使用萬用字元搜尋來聯集。以下資料庫支援這種類型的聯集:

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

如果在建立聯集之後新增或移除檔或表,您可以重新整理輸入步驟,用新資料或變更的資料來更新流程。

附註:此功能目前僅適用於 Excel 和 .csv(文字)檔案,以及存放在上面所列特定資料庫中的資料表。此選項不適用於 Tableau 資料擷取。

Tableau Prep Builder 版本 2018.1.2 及更新版本中提供了適用於檔案的萬用字元聯集。Tableau Prep Builder 版本 2018.3.1 及更新版本中提供了適用於資料庫表的萬用字元聯集。在以前的版本中編輯具有此聯集類型的流程連線可能會導致錯誤。

如果需要聯集來自不同資料來源的資料,您可以使用聯集步驟執行該操作。有關建立聯集步驟的詳情,請參閱聯集資料

聯集檔案

預設情況下,Tableau Prep Builder 會聯集您連線到的 .csv 檔案所在同一目錄中的所有 .csv 檔案,或者聯集您連線到的 Excel 檔中的所有工作表。如果使用 Data Interpreter 清理 Excel 檔案,並且使用的是 Tableau Prep Builder 版本 2018.1.2 或更新版本,您可以使用萬用字元搜尋來聯集和新增 Data Interpreter 找到的任何子表。

如果要變更預設聯集,請使用以下條件來查找要包括在聯集中的檔案或工作表:

  • 搜尋範圍:選取要用於搜尋檔的目錄。選中「包括子資料夾」核取方塊以包括父資料夾的子目錄中的檔案。

  • 檔案:選取是否包括或排除與萬用字元搜尋條件匹配的檔案。

  • 匹配模式(xxx*):輸入萬用字元搜尋模式以查找檔案名中包含這些字元的檔案。舉例來說,如果輸入 ord*,則會返回包括該檔案名的所有檔案。將此欄位留空以包括指定目錄中的所有檔案。

若要聯集輸入步驟中的檔案,請執行下列操作:

  1. 按一下「新增連線」按鈕,並在「連線」下按一下「文字檔案」(適用於 .csv 檔案)或「Microsoft Excel」(適用於 Excel 檔案),然後選取要開啟的檔案。

  2. 「輸入」窗格中,選取「多個檔案」索引標籤,然後選取「萬用字元聯集」

    下面的範例顯示一個使用匹配模式的萬用字元聯集。「流程」窗格中「Orders_Central」輸入步驟上檔圖示上的加號表明該步驟包括一個萬用字元聯集。聯集中的檔案列在「已包括檔案」下。

  3. 使用搜尋、檔案和匹配模式選項來查找要聯集的檔案。

  4. 按一下「套用」以聯集檔案。

向流程中新增新步驟時,您可以在「設定檔」窗格的「聯集路徑」欄位中看到新增到資料集的所有檔案。此欄位是自動新增的。

聯集資料庫資料表(版本 2018.3.1 及更新版本)

  1. 按一下「新增連線」 按鈕,並在「連線」下連線到支援萬用字元聯集的資料庫。

  2. 將表拖到流程窗格。

  3. 「輸入」窗格中,選取「多個表格」索引標籤,然後選取「萬用字元聯集」

  4. 使用搜尋、「表格」「匹配模式」選項來查找要聯集的表格。

    只有顯示在「連線」窗格的「表格」部分中的表格才能包括在聯集中。萬用字元搜尋不會跨架構或跨資料庫連線進行搜尋來查閱資料表。

  5. 按一下「套用」以聯集表格資料。

    向流程中新增新步驟時,您可以在「設定檔」窗格的「表格名稱」欄位中看到新增到資料集的所有表格。此欄位是自動新增的。

在聯集之後合併欄位

在輸入步驟中建立聯集後,您可能需要合併欄位。您可以在除「輸入」或「輸出」步驟之外的任何後續步驟中執行此操作。有關詳情,請參閱其他合併欄位選項

在輸入步驟中加入資料(版本 2019.1.3 及更新版本)

連線到包含具有關聯資料之表格的資料庫時,Tableau Prep Builder 可以偵測並顯示表格中已識別為唯一識別碼的欄位,以及已識別為相關欄位的欄位,還會顯示這些欄位的相關資料表名稱。

「輸入」窗格中會顯示稱為「連結金鑰」的新欄,此欄會顯示下列關聯(如果存在):

  • 唯一識別碼。此欄位可唯一識別資料表中的每一列。資料表中可以有多個唯一識別碼。欄位中的值必須是唯一的,而且不能是空白或 Null。

  • 相關欄位。此欄位將資料表關聯到資料庫中的另一個資料表。資料表中可以有多個相關欄位。

  • 「唯一識別碼」和相關欄位。此欄位是此資料表中的唯一識別碼,也將此資料表關聯到資料庫中的另一個資料表。

您可以使用這些關聯快速尋找相關表格並將其新增到您的流程,或者從「輸入」步驟中建立聯結。此功能可供任何定義了資料表關聯的受支援資料庫連接器使用。

  1. 連線至包含欄位關聯資料的資料庫(例如 Microsoft SQL Server),例如唯一識別碼或相關欄位(外部索引鍵)。
  2. 在「輸入」窗格中,按一下標示為 相關欄位或同時標示為 唯一識別碼和相關欄位的欄位。

    會開啟一個對話方塊,其中顯示相關資料表的清單。

  3. 將滑鼠懸停在您要新增或聯結的資料表上,然後按一下加號按鈕將資料表新增至您的流程,或按一下聯結按鈕以建立包含選取資料表的聯結。

    如果您建立聯結,Tableau Prep Builder 則使用定義的欄位關聯來聯結資料表,並顯示要用來建立聯結的聯結子句預覽。

  4. 或者,您也可以從「流程」窗格中的功能表聯結相關資料表。將滑鼠懸停在某一步上,直到出現加號 圖示,然後選取「新增聯結」以查看相關資料表的清單。Tableau Prep Builder 根據構成兩個資料表之間關聯的欄位建立聯結。

    附註:如果您的資料表沒有定義資料表關聯,則無法使用這個選項。

有關使用聯結的詳細資訊,請參閱聯結資料

感謝您的回饋! 提交意見回饋時發生錯誤。重試或傳送訊息給我們