在輸入步驟中新增更多資料
附註:從版本 2020.4.1 開始,現在可以在 Tableau Server 和 Tableau Cloud 中建立和編輯流程。除非特別說明,否則本主題中的內容適用於所有平台。有關在 Web 上製作流程的詳情,請參閱 Tableau Server(連結在新視窗開啟) 和 Tableau Cloud(連結在新視窗開啟) 說明中的 Web 版 Tableau Prep。
連線至資料來源並開始建立流程後,需要在新資料傳入時重新整理資料連線。也可以在輸入步驟聯結或聯集資料集,以提升處理更多資料來源的效率。
重新整理輸入步驟資料或變更連線
如果開始處理流程後輸入檔案或表格中的資料發生變化,可以重新整理輸入步驟為引入新資料,或者可以輕鬆變更和更新各個輸入步驟連線,而不會中斷流程。
重新整理資料來源
適用於檔案類型。Web 上尚不支援。
執行以下操作之一:
在流程窗格中,以滑鼠右鍵按一下要重新整理的「輸入」步驟,並從功能表中選取「重新整理」。
在流程窗格中的頂端功能表上,按一下「重新整理」按鈕以重新整理所有「輸入」步驟。若要重新整理單個「輸入」步驟,請按一下重新整理按鈕旁邊的下拉箭頭,並從清單中選取該「輸入」步驟。
取代資料來源
適用於 Tableau Prep Builder 和 Web 上的檔案類型、資料來源和資料擷取。
通過編輯單個輸入連線或用不同的資料來源替換單個流程資料來源來重新整理資料來源。
編輯連線
使用此選項可以輕鬆重新整理憑證或將資料來源取代為相同的資料來源類型。
附註:為保持效能,Tableau Prep 會對大型資料集進行抽樣。如果您的資料已抽樣,您可能會在設定檔窗格中看到您的新資料。您可以在「輸入步驟」的「資料樣本」索引標籤中變更資料抽樣方式的設定,但這可能會影響效能。有關設定資料樣本大小的詳細資訊,請參閱設定資料範例大小(連結在新視窗開啟)。
在「連線」窗格中,按一下滑鼠右鍵,或按住 Ctrl 並按一下 (MacOS) 資料來源,然後選取「編輯」。
登入資料庫或重新選取檔案或 Tableau 擷取,以重新建立您的連線。
取代輸入連線
在不中斷流程連線的情況下,使用任何新資料來源輕鬆取代流程中的現有資料來源。根據 Tableau Prep 版本,可以將新資料來源拖放到舊資料來源上,或者手動中斷連線並重新連線資料來源。
拖放以取代輸入連線(版本 20224. 及更高版本)
從「連線」窗格中,將新表拖曳到要取代的輸入步驟頂端的流程窗格中,然後將其放在「取代」選項上。
根據需要重新設定任何設定並修復任何錯誤。
在流程窗格中,以滑鼠右鍵按一下要重新整理的「輸入」步驟,並從功能表中選取「移除」。
這會使您的流程暫時處於錯誤狀態。
- 連線到新的或更新的資料來源。
將表格拖到流程窗格中要向其中新增「輸入」步驟的流程中的第二個步驟上。將其放在「新增」選項上,以將其重新連線到流程。
輸入步驟中的聯集檔案和資料庫資料表
輸入聯集只能在 Tableau Prep Builder 中編輯和建立,但可以排程在 Web 上執行。
在處理來自單一資料來源的多個檔案或資料庫資料表時,可以套用篩選器來搜尋檔案或使用萬用字元搜尋來尋找資料表,然後聯集資料以在輸入步驟中包含所有檔案或資料表資料。要聯集檔案,檔案必須位於同一目錄或子目錄中。
附註:此選項不適用於 Tableau 資料擷取。
下次開啟流程或從命令列執行流程時,新增到同一資料夾且符合篩選準則的新檔案會自動包含在聯集中。
封裝的流程檔案(.tflx)不會自動挑選新檔案,因為檔案已與流程封裝在一起。若要將新檔案包含在封裝的流程中,請在 Tableau Prep Builder 中開啟流程檔案(.tfl)以揀選新檔案,然後重新封裝流程,以包含新檔案資料。
要聯集資料庫資料表,這些表必須位於同一資料庫中,並且資料庫連線必須支援使用萬用字元搜尋。以下資料庫支援這種類型的聯集:
Amazon Redshift
Microsoft SQL Server
MySQL
Oracle
PostgreSQL
如果在建立聯集之後新增或移除檔或表,您可以重新整理輸入步驟,用新資料或變更的資料來更新流程。
如果需要聯集來自不同資料來源的資料,您可以使用聯集步驟執行該操作。有關建立聯集步驟的詳情,請參閱聯集資料(連結在新視窗開啟)。
聯集檔案
預設情況下,Tableau Prep Builder 會聯集您連線到的 .csv 檔案所在同一目錄中的所有 .csv 檔案,或者聯集您連線到的 Excel 檔中的所有工作表。
若要變更預設聯集,可以指定其他篩選準則來尋找要包含在聯集中的檔案或工作表。
核心篩選準則
在 Tableau Prep Builder 版本 2022.1.1 及更早版本中,可以從以下準則中進行選取:
搜尋範圍:選取要用於搜尋檔的目錄。選中「包括子資料夾」核取方塊以包括父資料夾的子目錄中的檔案。
檔案:選取是否包括或排除與萬用字元搜尋條件匹配的檔案。
匹配模式(xxx*):輸入萬用字元搜尋模式以查找檔案名中包含這些字元的檔案。例如,若輸入 order*,則會傳回檔案名稱中包含「order」的所有檔案。將此欄位留空以包括指定目錄中的所有檔案。
其他篩選器
在 Tableau Prep Builder 版本 2022.2.1 及更高版本中以及發佈到 Tableau Cloud 的流程中受支援。
附註:若在流程中使用其他篩選器,則流程排程功能目前只能在使用 Tableau Cloud 時可用。可以在 Tableau Prep Builder 中手動執行流程,或透過命令列介面執行。此功能與 Tableau Server 版本 2022.1 及更早版本不相容。
從 Tableau Prep Builder 版本 2022.2.1 及更高版本開始,搜尋要聯集檔案時的篩選選項已變更。雖然仍然可以指定要搜尋的目錄和子目錄,但現在可以設定多個篩選器來執行更細微的搜尋。
這些篩選選項適用於文字、Microsoft Excel 和統計檔案類型。可以選取多個篩選器。每個篩選器都會按照選取的順序從上到下分別套用。目前,篩選器在新增後無法移動,但可以根據需要刪除和新增篩選器。
從以下篩選器中選取:
篩選器 | 說明 |
---|---|
檔案名稱 | 為檔案名稱模式選取符合或不符合。例如「訂單*」。 |
檔案大小 | 透過選取大小範圍或按大小排序來篩選檔案。 大小範圍:從以下選項中選取:
按大小排序:包括或排除 N 個最大或最小的檔案。 |
建立日期 | 透過選取日期範圍、相對日期或按日期排序來篩選檔案。 日期範圍:從以下選項中選取:
相對日期:包括或排除年、季度、月、週或日的精確範圍。還可以設定相對於特定日期的錨點。 附註:「最近」日期時間段包括完整的目前時間單位,即使某些日期尚未發生。例如,若選取「最近一個月」,而目前日期為 1 月 7 日,Tableau 將顯示 1 月 1 日至 1 月 31 日的日期。 按日期排序:包括或排除 N 個最新或最舊的檔案。 |
修改日期 | 透過選取日期範圍、相對日期或按日期排序來篩選檔案。 日期範圍:從以下選項中選取:
相對日期:包括或排除年、季度、月、週或日的精確範圍。還可以設定相對於特定日期的錨點。 附註:「最近」日期時間段包括完整的目前時間單位,即使某些日期尚未發生。例如,若選取「最近一個月」,而目前日期為 1 月 7 日,Tableau 將顯示 1 月 1 日至 1 月 31 日的日期。 按日期排序:包括或排除 N 個最新或最舊的檔案。 |
附註:以下說明因您的 Tableau Prep Builder 而異。
建立輸入聯集
適用於 Tableau Prep Builder 版本 2022.2.1 及更高版本
按一下新增連線 按鈕,並在連線下按一下文字檔案(適用於 .csv 檔案)、Microsoft Excel(適用於 Excel 檔案)或統計檔案(適用於統計檔案),然後選取要開啟的檔案。
在輸入窗格中,選取表索引標籤,然後選取聯集多個表。
- 選取要搜尋的資料夾。還可以包括指定目錄下列出的所有子資料夾,以擴充搜尋。
按一下新增檔案篩選器,從以下選項中進行選取:
- 檔案名稱:輸入要搜尋的名稱模式。
- 檔案大小:按大小範圍搜尋或按大小排序。
- 建立日期:按日期範圍、相對日期搜尋或按日期排序。
- 修改日期:按日期範圍、相對日期搜尋或按日期排序。
再次按一下新增檔案篩選器,以新增更多篩選器。
篩選結果會顯示在包含的表格區段。
按一下「套用」以聯集檔案。
向流程中新增新步驟時,您可以在「設定檔」窗格的「聯集路徑」欄位中看到新增到資料集的所有檔案。此欄位是自動新增的。
按一下新增連線 按鈕,並在連線下按一下文字檔案(適用於 .csv 檔案)或 Microsoft Excel(適用於 Excel 檔案),然後選取要開啟的檔案。
在「輸入」窗格中,選取「多個檔案」索引標籤,然後選取「萬用字元聯集」。
下面的範例顯示了使用比對模式的輸入聯集。若流程窗格中「Orders_Central」輸入步驟上的檔案圖示上有加號,則表示此步驟包括輸入聯集。聯集中的檔案列在「已包括檔案」下。
使用搜尋、檔案和匹配模式選項來查找要聯集的檔案。
按一下「套用」以聯集檔案。
向流程中新增新步驟時,您可以在「設定檔」窗格的「聯集路徑」欄位中看到新增到資料集的所有檔案。此欄位是自動新增的。
聯集資料庫資料表
在 Tableau Prep Builder 版本 2018.3.1 及更高版本中受支援
附註:Tableau Prep Builder 版本 2022.2.1 中已更新資料庫資料表的輸入聯集介面。您的選項可能會因版本而有所不同。
按一下新增連線 按鈕,並在連線下連線到支援輸入聯集的資料庫。
將表拖到流程窗格。
在輸入窗格中,選取表索引標籤,然後選取聯集多個表。
在以前的版本中,選取多個表索引標籤,然後選取萬用字元聯集。
在表欄位中,從下拉選項中選取包括或排除,然後輸入比對模式,以尋找要聯集的表。
在以前的版本中,使用搜尋、表和比對模式選項。
只有顯示在「連線」窗格的「表格」部分中的表格才能包括在聯集中。輸入聯集搜尋不會跨結構或跨資料庫連線進行搜尋以尋找資料表。
按一下「套用」以聯集表格資料。
向流程中新增新步驟時,您可以在「設定檔」窗格的「表格名稱」欄位中看到新增到資料集的所有表格。此欄位是自動新增的。
在聯集之後合併欄位
在輸入步驟中建立聯集後,您可能需要合併欄位。您可以在除「輸入」或「輸出」步驟之外的任何後續步驟中執行此操作。有關詳情,請參閱其他合併欄位選項(連結在新視窗開啟)。
在 [輸入] 步驟中聯結資料
在 Tableau Prep Builder(版本 2019.3.1 和更高版本)以及 Web 版本中,連線到包含具有關係資料之表格的資料庫時,Tableau Prep 可以偵測並顯示表格中已識別為唯一識別碼的欄位,以及已識別為相關欄位的欄位,還會顯示這些欄位的相關資料表名稱。
「輸入」窗格中會顯示稱為「連結金鑰」的新欄,此欄會顯示下列關聯(如果存在):
唯一識別碼。此欄位可唯一識別資料表中的每一列。資料表中可以有多個唯一識別碼。欄位中的值必須是唯一的,而且不能是空白或 Null。
相關欄位。此欄位將資料表關聯到資料庫中的另一個資料表。資料表中可以有多個相關欄位。
「唯一識別碼」和相關欄位。此欄位是此資料表中的唯一識別碼,也將此資料表關聯到資料庫中的另一個資料表。
您可以使用這些關聯快速尋找相關表格並將其新增到您的流程,或者從「輸入」步驟中建立聯結。此功能可供任何定義了資料表關聯的受支援資料庫連接器使用。
- 連線至包含欄位關聯資料的資料庫(例如 Microsoft SQL Server),例如唯一識別碼或相關欄位(外部索引鍵)。
在「輸入」窗格中,按一下標示為 相關欄位或同時標示為 唯一識別碼和相關欄位的欄位。
會開啟一個對話方塊,其中顯示相關資料表的清單。
將滑鼠懸停在您要新增或聯結的資料表上,然後按一下加號按鈕將資料表新增至您的流程,或按一下聯結按鈕以建立包含選取資料表的聯結。
若建立聯結,Tableau Prep 會使用定義的欄位關係來聯結資料表,並顯示將用於建立聯結的聯結子句預覽。
或者,您也可以從「流程」窗格中的功能表聯結相關資料表。按一下加號 圖示,然後選取「新增聯結」以查看相關資料表的清單。Tableau Prep 會根據構成兩個表之間關係的欄位建立聯結。
附註:如果您的資料表沒有定義資料表關聯,則無法使用這個選項。
有關使用聯結的詳細資訊,請參閱聯結資料(連結在新視窗開啟)。