檢查資料

使用本主題中的選項,透徹理解資料的組成,從而更好地瞭解所需進行的變更,以及流程中包括的操作的效果。

查看指派給資料的資料類型

像 Tableau Desktop 一樣,Tableau Prep Builder 會在您將連線拖到「流程」窗格中時對資料進行解讀,並自動為其指派一個資料類型。由於不同的資料庫可能會以不同的方式處理資料,因此 Tableau Prep Builder 的解讀可能不會始終正確。

若要變更資料類型,請按一下資料類型圖示,並從內容功能表中選取正確的資料類型。您可以將「字串」或「整數」資料類型變更為「日期」或者「日期和時間」,Tableau Prep Builder 將觸發「Auto DateParse」來變更這些資料類型。像 Tableau Desktop 一樣,如果變更未成功,您將會在欄位中看到 Null 值,並且您可以建立計算來進行變更。

有關使用 DateParse 的詳細資訊,請參閱 Tableau Desktop 和 Web 製作說明中的將欄位轉換為日期欄位

查看有關資料的大小詳細資訊

連線到資料後,向流程中新增一個表,然後新增一個步驟。您可以使用「設定檔」窗格來查看資料的目前狀態和結構,並找出 null 值和離群值。

  • 欄位數和列數:在「設定檔」窗格的左上角,您可以找到在流程的某個特定點資料中的欄位數和列數的匯總。Tableau Prep Builder 會舍入到最接近的千位。在以下的範例中,資料集中有 21 個欄位和 3000 列。

    將游標暫停在欄位數和列數上時,您可以看到確切的列數(本例中為 2848):


  • 資料集大小:透過在「輸入」窗格的「資料樣本」索引標籤中指定要包括的列數來使用資料子集。

  • 已抽樣:為了讓您能夠與資料直接交互,Tableau Prep Builder 會使用原始資料的子集。列數由資料類型和所呈現的欄位數確定。與整數相比,字串欄位會佔用更多的儲存空間,因此,如果資料集中有 10 個字串欄位,與有 10 個整數欄位的情況相比,您得到的列數可能會更少。「已抽樣」 指示符顯示在「設定檔」窗格中大小詳細資訊的旁邊,用於指明這是資料集的子集。有關資料樣本的詳情,請參閱設定資料集

  • 唯一值的數量:每個欄位標題旁邊的數字表示該欄位內包含的不同值。Tableau Prep Builder 會舍入到最接近的千位。在下面的範例中,「說明」欄位中呈現的不同值為 3,000 個,但如果將游標暫停在數位上,您可以看到唯一值的確切數量。



查看值或唯一值的分佈

預設情況下,Tableau Prep Builder 會將欄位中的數位、日期和日期時間值分組為貯體。這些貯體也稱為資料桶。資料桶確保您能查看值的整體分佈狀況,並快速確定離群值和 null 值。資料桶大小是基於欄位中的最小值和最大值計算得出的,並且 null 值始終顯示在分佈的頂端。

例如,將按年份對訂單和發貨日期進行匯總或「分筒」。每個資料桶都表示從起始年份一月份到下一年一月份的一年,並帶有相應標籤。由於有處於 2018 年和 2019 年下半年的銷售日期及發貨日期,因此將針對這些值為以下年度建立資料桶。

如果離散(或分類)資料欄位包含許多列,或者其具有的分佈太大,如果不滾動就無法顯示在欄位中,您可能會在欄位的右側看到匯總分佈。您可以在分佈中按一下和滾動來定位特定值。

如果資料包含數位或日期欄位,您可以切換顯示值的詳細(離散)版本或值的匯總(連續)版本。匯總檢視顯示欄位中的值範圍,以及某些值的出現頻率。

這種切換可幫助您隔離唯一值(比如欄位中的「3」記錄數)或值的分佈(比如欄位中所有「3」記錄的總和)

切換檢視:

  1. 在「設定檔」窗格、「結果」窗格或資料網格中,按一下數值或日期欄位的「更多選項」功能表。

  2. 在內容功能表中,選取「詳細資訊」以查看值的詳細版本,或選取「摘要」以查看值的分散式版本。

搜尋欄位和值

在「設定檔」窗格或「結果」窗格中,您可以搜尋您特別感興趣的欄位或值,並使用搜尋結果來篩選資料。

若要搜尋欄位,請在工具列上的搜尋框中輸入全部或部分搜尋詞。

在欄位中搜尋值:

  1. 按一下欄位的搜尋圖示 ,並輸入一個值。

  2. 若要使用高級搜尋選項,請按一下「搜尋選項」...按鈕。

  3. 若要使用搜尋結果來篩選資料,請選取「只保留」「排除」

    「流程」窗格中,受影響的步驟上方將出現一個篩選器圖示。

對值和欄位進行排序

「設定檔」卡上的排序選項使您能按遞增或遞減對資料桶(由分佈條形表示的值計數)進行排序,或按字母順序對單獨的欄位值進行排序。

如果要重新排列欄位的順序,只需在「設定檔」窗格、「結果」窗格或「資料」網格中選取並拖動設定檔卡或資料網格中的欄位,直至出現黑色定位線為止。然後將其放置到位。「設定檔」窗格和資料網格是同步的,因此欄位將以相同的順序出現在兩個位置中。

反白顯示流程中的欄位和值

利用 Tableau Prep Builder 可輕鬆地尋找流程資料中的欄位和值。在流程窗格中跟蹤欄位的來源以及在流程中的何處使用了欄位,或者在設定檔卡或資料網格中按一下單獨的值以反白顯示相關值或相同的值。

在流程中跟蹤欄位

在 Tableau Prep Builder 版本 2018.3.3 及更新版本中,您可以反白顯示欄位的每處使用位置,甚至可以跟蹤欄位的來源,從而可幫助您在未看到預期結果時找出缺少的值或排查流程故障。

在清理步驟的「設定檔」窗格中或任何其他步驟類型的「結果」窗格中按一下某個欄位,流程窗格將反白顯示其中使用了該欄位的路徑。

附註:此選項不可用於「輸入」或「輸出」步驟類型。

查看相關值

您可以使用反白顯示來查找欄位之間的相關值。當您在「設定檔」窗格或「結果」窗格的「設定檔」卡中按一下某個值時,其他欄位中的所有相關值會以藍色反白顯示。藍色顯示您選取的值與其他欄位中的值之間的關係分佈。

例如,若要反白顯示相關值,請在「設定檔」窗格中按一下欄位中的一個值。其他欄位中的相關值將變為藍色,以藍色反白顯示的條形比例表示關聯程度。

反白顯示相同的值

在資料網格中選取值時,所有相同的值也會反白顯示。這些反白顯示可幫助您確定資料中的模式或不規則情況。

感謝您的回饋! 提交意見回饋時發生錯誤。重試或傳送訊息給我們