附註:從版本 2020.4.1 開始,現在可以在 Tableau Server 和 Tableau Cloud 中建立和編輯流程。除非特別說明,否則本主題中的內容適用於所有平台。有關在 Web 上製作流程的詳情,請參閱 Tableau Server(連結在新視窗開啟) 和 Tableau Cloud(連結在新視窗開啟) 說明中的 Web 版 Tableau Prep。
若要確定在流程中包括多少資料集,您可以設定資料集。當您連線至資料或將表拖到「流程」窗格中時,會自動向流程中新增一個輸入步驟。
在輸入步驟中,您可以決定要在流程中包含多少以及包含哪些資料。這始終是該流程中的第一步。
如果連線到 Excel 或文字檔案,您還可以從輸入步驟中重新整理資料。更多資訊請參閱在輸入步驟中新增更多資料(連結在新視窗開啟)。
在輸入步驟中,您可以:
- 在輸入步驟以滑鼠右鍵按一下或 Cmd + 按一下滑鼠左鍵 (MacOS) ,重新命名或將其移除。
- 在同一上層目錄或下層目錄中聯集多個檔案。更多資訊請參閱輸入步驟中的聯集檔案和資料庫資料表。
- (版本 2023.1 及更高版本)包括根據資料集的原始排序順序自動生成的列號。參閱包括資料集中的列號.
- 搜尋欄位。
- 請參閱欄位值範例。
還可以透過變更欄位名稱設定欄位內容,或設定文字檔的文字設定。
附註:包括方括號的欄位值會自動轉換為圓括號。
- 執行動作以變更流程中包含的資料。參看選取資料樣本大小
- 設定要在流程中使用的資料樣本。
- 移除不需要的欄位。始終可以之後返回到輸入步驟包含它們。
- 隱藏不需要清除的欄位,同時仍將希望在您的流程中包含它們。如果需要,可以隨時取消隱藏。
- 將篩選條件套用至選定的欄位。
變更支援它的資料連線的欄位資料類型。
這些包括 Microsoft Excel、文字和 PDF 檔,以及來自 Box、Dropbox、Google 雲端硬碟和 OneDrive 的資料。如果是其他資料來源,可以在「清除」步驟中變更資料類型。
有關更多資訊,請參閱查看指派給資料的資料類型
包括資料集中的列號
在 Tableau Prep Builder 版本 2023.1 及更高版本中以及在 Web 上支援 Microsoft Excel 和文本 (.csv) 檔案。
附註:當前不支援輸入聯合中包含的檔案使用此選項。
從版本 2023.1 開始,Tableau Prep 會自動為您產生 Microsoft Excel 或文本 (.csv) 檔案類型的列號欄位。在之前的版本中,如果要包含基於資料原始排序順序的列號,就必須在將資料集新增至流程前手動將其新增至該來源中。
連線至您的資料時,在輸入步驟中產生該欄位。預設會將其排除在流程外,但您可以按一下將其包括在內。新增至您的流程後,其行為與任何其他欄位一樣,可用於您的流程動作和計算欄位。
Tableau Prep 還支援計算欄位的 ROW_NUMBER 函數。如果資料集中有可以定義排序的欄位(例如 Row ID 或 Timestamp),此函數很有用。有關使用此功能的更多資訊,請參閱 建立詳細資料層級、順序和動態磚計算。
在您的流程中新增「來源列號」欄位
在該欄位中右鍵按一下或 Cmd + 按一下滑鼠左鍵 (MacOS) ,或按一下 「更多選項」
功能表並選取「包含欄位」。
已清除變更清單,該欄位現在是流程資料的一部分,您可以在後續流步驟中看到產生的列號。
「來源列號」詳細資訊
在您的資料集中納入「來源列號」後即可套用以下選項和注意事項。
- 可在任何資料採樣或篩選前套用該資料來源列號。
- 每個表格均有其各自獨特的來源列號。聯集中的每個輸入都將保持原始排序順序。
- 這樣會建立一個在整個流程中持續存在,名為「來源列號」的心欄位。此欄位名稱未當地化,但可以隨時重命名。
- 如果已存在使用此名稱的欄位,則新欄位名稱會遞增 1。例如,來源列號 - 1, 來源列 2, 等等。
- 您可以在後續步驟中變更該欄位的資料類型。
- 您可以在流程操作和計算中使用該欄位。
- 每次重新整理輸入資料或執行流程時,都會為整個資料集重新產生此值。
- 該欄位不可用於輸入聯集。
連線到自訂 SQL 查詢
如果資料庫支援使用自訂 SQL,您將會看到「自訂 SQL」顯示在「連線」窗格靠近底部的位置。按兩下「自訂 SQL」開啟「自訂 SQL」 索引標籤,您可以在其中輸入查詢來預選取資料和使用特定於來源的操作。查詢檢索資料集之後,您可以選取要包括的欄位、套用篩選器,或在將資料新增到流程之前變更資料類型。
有關使用自訂 SQL 的詳情,請參閱使用自訂 SQL 連線到資料。
在輸入步驟中套用清理操作
只能在「輸入」步驟中執行部分清除操作。您可以在「輸入」欄位清單中進行以下任何變更。系統會在「變更」窗格中跟蹤您所做的變更,並會在「流程」窗格中「輸入」步驟的左側以及「輸入」欄位清單中新增注釋。
- 隱藏欄位:隱藏欄位而不是將其移除以減少流程中的混亂。需要時可隨時取消隱藏。執行流程時,隱藏欄位仍將包含在內。
- 篩選:使用計算編輯器篩選值,或從版本 2023.1 開始,可以使用「相對日期篩選條件」對話方塊,快速指定任意日期或日期和時間欄位的日期範圍。
重命名欄位:在「欄位名稱」欄位中,按兩下或按住 Ctrl 再按一下 (MacOS) 欄位名稱,並輸入一個新欄位名稱。
變更資料類型:按一下欄位的資料類型,並從功能表中選取一個新資料類型。Microsoft Excel、文字和 PDF 檔案、Box、Dropbox、Google 雲端硬碟和 OneDrive 資料來源目前支援此選項。所有其他資料來源都可以在清理步驟中變更。
選取要包含在流程中的欄位
附註:從版本 2023.1 開始,您可以選取多個欄位進行隱藏、取消隱藏、移除或包含動作。在之前版本中,可以一次哦處理一個欄位,並選中或清除核取方塊以包含或刪除欄位。
「輸入」窗格顯示資料集中的欄位清單。預設情況下,除自動產生的欄位 「來源列號」外,所有欄位都包括在內。使用以下選項管理您的欄位。
- 搜尋:在此清單中搜尋欄位。
- 隱藏: 按一下眼睛
圖示,或選取 「更多」
選項功能表中的「隱藏欄位」,隱藏您想要包含在流程中但不需要清除的欄位。在執行階段由流程處理欄位。更多資訊請參閱隱藏欄位(連結在新視窗開啟)。
- 包含欄位:選取一列或多列,並按一下鼠標右鍵,Cmd + 按一下滑鼠左鍵 (MacOS) ,或按一下 「更多」選取
功能表,並選取「包含欄位」,新增標記為已刪除的欄位。
- 刪除欄位:選取一列或多列並按一下鼠標右鍵,Cmd + 按一下滑鼠左鍵 (MacOS) ,按一下「X」,或按一下「更多」選取
功能表,並選取「移除欄位」,移除您不想包含在流程中的欄位。
將篩選器應用於輸入步驟中的欄位
在輸入步驟中,您可以使用計算編輯器套用篩選條件。從版本 2023.1 開始,還可以在日期欄位新增相對日期篩選條件,為具體日期範圍在我們的流程加入資料。更多資訊請參閱篩選資料(連結在新視窗開啟)中的「相對日期篩選條件」。
在其他步驟類型中可以執行其他篩選條件選項。有關詳情,請參閱篩選資料(連結在新視窗開啟)。
套用計算篩選條件
在工具列中,按一下「篩選值」。
在計算編輯器中輸入篩選條件。
套用相對日期篩選條件
在「輸入」方格中選取資料類型為日期或日期和時間的欄位。然後右鍵按一下/ md + 按一下滑鼠左鍵 (MacOS) ,或按一下 「更多」選項
功能表,並選取「篩選條件」 > 「相對日期」。
使用「相對日期篩選條件」對話方塊指定要在資料中查看的年、季度、月、週或日的精確範圍。您也可以設定相對於特定日期錨點,並包括 null 值。
變更欄位名稱
若要變更欄位的名稱,請在「欄位名稱」欄中選取名稱,然後在欄位中鍵入新名稱。將會在欄位網格以及「輸入」步驟左側的流程窗格中新增註解。系統也會在「變更」窗格中跟蹤您所做的變更。
變更資料類型
目前支援 Microsoft Excel、文字和 PDF 檔案、Box、Dropbox、Google 雲端硬碟和 OneDrive 資料來源。所有其他資料來源都可以在清理步驟中變更。
附註:來源列號(2023.1 及更高版本)的資料類型只能在清理步驟或其他步驟類型中變更。
要變更欄位的資料類型,請執行以下作業:
按一下欄位的資料類型。
從功能表中選取新資料類型。
您也可以變更流程中其他步驟類型之欄位的資料類型,或指派資料角色以幫助驗證您的欄位值。有關變更您的資料類型或使用資料角色的詳情,請參閱查看指派給資料的資料類型(連結在新視窗開啟)和使用資料角色以驗證您的資料(連結在新視窗開啟)。
設定欄位屬性
處理文字檔時,您會看到「設定」索引標籤,在該索引標籤中,您可以編輯連線和設定文字屬性,例如文字檔的欄位分隔符號。也可以在「連線」窗格中編輯檔案連線或設定累加式重新整理設定。有關為流程設定累加式重新整理的詳情,請參閱使用累加式重新整理重新整理流程資料。
處理文字或 Excel 檔時,您可以糾正在開始流程之前錯誤推斷的資料類型。在開始流程之後,始終可以在後續步驟中透過「設定檔」窗格變更資料類型。
設定文字檔中的文字設定
若要變更用於解析文字檔的設定,請從以下選項中選取:
第一行包含標題(預設值):選取此選項以使用第一列作為欄位標籤。
自動產生欄位名稱:如果希望 Tableau Prep Builder 自動產生欄位標題,請選取此選項。欄位命名約定採用與 Tableau Desktop 相同的模式。例如,F1、F2 等。
欄位分隔符號:從清單中選取一個字元用於分隔各個欄目。選取「其他」以輸入自訂字元。
文字限定詞:選取用於在檔中將值引起來的字元。
字元集:選取用於描述文字檔編碼的字元集。
區域設定:選取要用於解析檔的區域設定。此設定指明要使用哪個小數分隔符號和千位分隔符號。
選取資料樣本大小
要維持最佳效能,預設情況下,Tableau Prep 會將流程中包含的資料限制為資料集的代表性樣本。透過根據資料集中的欄位總數和這些欄位的資料類型來計算最佳列數,即可確定資料樣本。Tableau Prep 隨後即會儘快針對計算量檢索最多的列數。
產生的資料樣本可能包括您需要的所有列,也可能不包括,具體情況取決於樣本的計算和返回方式。如果看不到預期資料,您可以變更資料樣本設定以再次執行查詢。
在 Web 上建立或編輯流程時,將限制可包含在流程中的資料量,並且可用於變更資料樣本的選項與在 Tableau Prep Builder 中使用時略有不同。有關詳情,請參閱 Tableau Server(連結在新視窗開啟) 或 Tableau Cloud(連結在新視窗開啟) 說明中的範例資料和處理限制。
附註:如果已對資料抽樣,則「設定檔」窗格中會顯示一個「已抽樣」 徽章,並且該徽章會在您新增的每個步驟中持續存在。所做的任何變更將套用到您在流程中處理的樣本。在執行流程時,所有變更都將套用於整個資料集。
若要變更資料樣本設定,請選取一個輸入步驟,然後在「資料樣本」索引標籤上從以下選項中進行選取:
預設樣本量(預設值):Tableau Prep 會計算要返回的總列數。
使用所有資料:(僅適用於 Tableau Prep Builder)檢索資料集中的所有列,而不管大小如何。這可能會影響效能,或導致 Tableau Prep Builder 超時。
附註:為了保持效能,即使您選取此設定,「彙總」和「聯集」步驟類型會套用 100 萬列的資料樣本限制,而「聯結」和「樞紐」步驟類型會套用 300 萬列的資料樣本限制。
固定列數:選取要從資料集返回的列數。推薦的列數為 100 萬列或更少。將列數設定為超過 100 萬列可能會影響效能。
- 在 Web 製作中:管理員會設定使用者在使用大型資料集時可以選取的最大列數。作為使用者,您可以選取不超過該限制的列數。
快速選取(預設值):資料庫會儘快返回請求的列數。這可能是前 N 列,或是上一次查詢中資料庫緩存在記憶體中的列數。
隨機抽樣:資料庫返回請求的列數,但會查看資料集中的每一列並從所有列中返回一個代表性樣本。在首次檢索資料時,此選項可能會影響效能。