設定資料集

若要確定在流程中包括多少資料集,您可以設定資料集。當您連線到資料或將表拖到「流程」窗格中時,會自動向流程中新增一個輸入步驟。這始終是流程中的第一步。您可以以滑鼠右鍵按一下輸入步驟以對其進行重命名或將其移除。如果連線到 Excel 或文字檔案,您還可以從輸入步驟中重新整理資料。有關如何從輸入步驟中重新整理資料的詳情,請參閱在輸入步驟中新增更多資料

在「輸入」步驟中,您可以看到關於資料集的詳細資訊。在這裡,您可以搜尋欄位、查看範例值,以及執行動作來縮小資料集的大小,例如選取要包括的欄位、選取要處理的資料樣本,或將篩選器應用於所選的欄位或列。您還可以透過變更欄位的資料類型或欄位名稱來設定欄位屬性,或設定文字檔的文字設定。

附註:包括方括號的欄位值會自動轉換為圓括號。

連線到自訂 SQL 查詢

如果資料庫支援使用自訂 SQL,您將會看到「自訂 SQL」顯示在「連線」窗格靠近底部的位置。按兩下「自訂 SQL」開啟「自訂 SQL」 索引標籤,您可以在其中輸入查詢來預選取資料和使用特定於來源的操作。查詢檢索資料集之後,您可以選取要包括的欄位、套用篩選器,或在將資料新增到流程之前變更資料類型。

有關使用自訂 SQL 的詳細資訊,請參閱 Tableau Desktop 和 Web 製作說明中的連線到自訂 SQL 查詢

在輸入步驟中套用清理操作

只能在「輸入」步驟中執行部分清除操作。您可以在「輸入」欄位清單中進行以下任何變更。系統會在「變更」窗格中跟蹤您所做的變更,並會在「流程」窗格中「輸入」步驟的左側以及「輸入」欄位清單中新增注釋。

  • 篩選:在工具列中按一下「篩選值」,然後在計算編輯器中輸入篩選條件。

  • 重命名欄位:「欄位名稱」欄位中,按兩下或按住 Ctrl 再按一下 (MacOS) 欄位名稱,並輸入一個新欄位名稱。

  • 變更資料類型:按一下欄位的資料類型,並從功能表中選取一個新資料類型。

  • 移除欄位:清除不想包括在流程中的欄位旁邊的核取方塊。

選取要包含在流程中的欄位

「輸入」窗格顯示資料集中的欄位清單。您可以使用「搜尋」欄位在清單中查找欄位,然後使用核取方塊來選取要包括或排除的欄位。若要在流程中包括或排除所有欄位,請切換網格頂端的核取方塊。

將篩選器應用於輸入步驟中的欄位

若要篩選欄位,請執行以下操作:

  1. 在工具列中,按一下「篩選值」

  2. 在計算編輯器中輸入篩選條件。

計算篩選類型是「輸入」步驟中唯一可用的篩選條件選項。在其他步驟類型中可以執行其他篩選條件選項。有關詳情,請參閱篩選資料

變更欄位名稱

若要變更欄位的名稱,請在「欄位名稱」欄中選取名稱,然後在欄位中鍵入新名稱。將會在欄位網格以及「輸入」步驟左側的流程窗格中新增註解。系統也會在「變更」窗格中跟蹤您所做的變更。

變更資料類型

若要變更欄位的資料類型,請執行以下操作:

  1. 按一下欄位的資料類型。

  2. 從功能表中選取新資料類型。

    您也可以變更流程中其他步驟類型之欄位的資料類型,或指派資料角色以幫助驗證您的欄位值。有關變更您的資料類型或使用資料角色的詳情,請參閱查看指派給資料的資料類型使用資料角色以驗證您的資料

設定欄位屬性

處理文字檔時,您會看到「文字設定」索引標籤,在該索引標籤中,您可以編輯連線和設定文字屬性,例如文字檔的欄位分隔符號。您也可以在「連線」窗格中編輯檔案連線。

處理文字或 Excel 檔時,您可以糾正在開始流程之前錯誤推斷的資料類型。在開始流程之後,始終可以在後續步驟中透過「設定檔」窗格變更資料類型。

設定文字檔中的文字設定

若要變更用於解析文字檔的設定,請從以下選項中選取:

  • 第一行包含標題(預設值):選取此選項以使用第一列作為欄位標籤。

  • 自動產生欄位名稱:如果希望 Tableau Prep Builder 自動產生欄位標題,請選取此選項。欄位命名約定採用與 Tableau Desktop 相同的模式。例如,F1F2 等。

  • 欄位分隔符號:從清單中選取一個字元用於分隔各個欄目。選取「其他」以輸入自訂字元。

  • 文字限定詞:選取用於在檔中將值引起來的字元。

  • 字元集:選取用於描述文字檔編碼的字元集。

  • 區域設定:選取要用於解析檔的區域設定。此設定指明要使用哪個小數分隔符號和千位分隔符號。

選取資料樣本大小

預設情況下,Tableau Prep Builder 會將流程中包括的資料限制為一個資料集的代表性樣本,以維持最佳效能。透過根據資料集中的欄位總數和這些欄位的資料類型來計算最佳列數,即可確定資料樣本。Tableau Prep Builder 隨後即會儘快針對計算量檢索最多的列數。

產生的資料樣本可能包括您需要的所有列,也可能不包括,具體情況取決於樣本的計算和返回方式。如果看不到預期資料,您可以變更資料樣本設定以再次執行查詢。

附註:如果已對資料抽樣,則「設定檔」窗格中會顯示一個「已抽樣」 指示符,並且該指示符會為您新增的每個步驟保留。所做的任何變更將套用於您在流程中處理的樣本。在執行流程時,所有變更都將套用於整個資料集。

若要變更資料樣本設定,請選取一個輸入步驟,然後在「資料樣本」索引標籤上從以下選項中進行選取:

  • 預設樣本量(預設值):Tableau Prep Builder 會計算要返回的總列數。

  • 使用所有資料:檢索資料集中的所有列,而不管大小如何。這可能會影響效能,或導致 Tableau Prep Builder 超時。

    附註:為了保持效能,即使您選取此設定,「彙總」和「聯集」步驟類型會套用 100 萬列的資料樣本限制,而「聯結」和「樞紐」步驟類型會套用 300 萬列的資料樣本限制。

  • 固定列數:選取要從資料集返回的列數。推薦的列數為 100 萬列或更少。將列數設定為超過 100 萬列可能會影響效能。

  • 快速選取(預設值):資料庫會儘快返回請求的列數。這可能是前 N 列,或是上一次查詢中資料庫緩存在記憶體中的列數。

  • 隨機抽樣:資料庫返回請求的列數,但會查看資料集中的每一列並從所有列中返回一個代表性樣本。在首次檢索資料時,此選項可能會影響效能。

感謝您的回饋! 提交意見回饋時發生錯誤。重試或傳送訊息給我們