重新整理擷取

當原始資料發生改變時,可以使用 Desktop 重新整理擷取,在「資料」功能表上選取資料來源,然後選取「擷取」「重新整理」。資料擷取可以透過兩種方式設定:完整重新整理或累加式重新整理。

透過完整重新整理,資料擷取中的所有資料都將取代為原始資料來源中的最新資訊。累加式重新整理僅新增自上次重新整理以來的新列。如果想了解有關如何擷取資料的更多詳情,可以造訪擷取您的資料頁面

附註:您還可以使用 Tableau 資料擷取命令列公用程式自動執行擷取重新整理。有關詳情,請參閱Tableau 資料擷取命令列公用程式

重新整理擷取之前

如果要重新整理擷取,請在執行擷取重新整理之前記下擷取的檔案格式。若使用版本 2022.4.tde 擷取執行重新整理,擷取會自動升級為 .hyper 擷取。雖然升級到 .hyper 擷取有許多好處,但是將無法使用以前版本的 Tableau Desktop 開啟擷取。有關詳情,請參閱擷取升級為 .hyper 格式

設定完整的擷取重新整理

預設情況下,擷取被設定為完全重新整理。這意味著每次重新整理擷取時,所有列都會替換為原始資料來源中的資料。雖然這種重新整理可確保您具有原始資料中的資料的精確副本,但在資料庫上執行完全重新整理有時需要很長時間並且開銷很大,具體取決於擷取的大小。如果未將擷取設定為累加式重新整理,則選取重新整理擷取將會完全重新整理擷取。

發佈到 Tableau Server

如果您打算將擷取作為資料來源發佈到 Tableau Server,則可以在發佈期間指定擷取重新整理排程。

同樣,如果您要將工作簿中的擷取發佈到 Tableau Server,則也可以在發佈期間指定擷取重新整理排程。有關詳情,請參閱發佈工作簿時排程擷取重新整理

發佈到 Tableau Cloud

如果打算將擷取以資料來源形式發佈到 Tableau Cloud,則用於重新整理資料的選項取決於您的資料來源的特徵。有關重新整理特定資料來源中的資料的詳細資料,請參閱按資料來源列出的擷取重新整理選項

設定增量擷取重新整理

大多數資料來源都支援累加式重新整理。您可以將重新整理設定為僅新增自上次擷取資料以來新增的列,而不是重新整理整個擷取。

例如,您可能有一個每天都使用新銷售交易進行更新的資料來源。您只需新增當天發生的新交易,而不是每天重新組建整個擷取。隨後,為了確保擁有最新資料,您可能需要每週執行一次完全重新整理。

從版本 2024.1 開始,Tableau 引入了一項功能,讓使用者能夠使用非唯一索引鍵資料行對資料擷取執行累加式重新整理。此更新在此過程中引入了一個額外步驟。在累加式重新整理期間,Tableau 首先從資料擷取中移除與先前記錄的最高值相符的列。隨後,Tableau 查詢值高於或等於前一個最高值的所有列。此方法可確保所有已刪除的列以及所有新增的列都有納入。

「進階設定」功能提供兩個用於管理資料更新的選項。可以選擇透過重新整理等於或大於最後記錄值的值來取代最後新增的列。或者,可以選擇僅重新整理值大於最後記錄值的資料擷取來保留最後新增的列。有關詳情,請參閱「設定累加式擷取重新整理」。

附註:如果來源資料的資料結構發生變更(例如,新增了列),則需要執行完整的擷取重新整理,然後才能再次開始執行累加式重新整理。

你可以按以下步驟將擷取設定為累加式重新整理。

  1. 「資料」功能表中選取資料來源,然後選取「擷取資料」

  2. 在 [擷取資料] 對話方塊中,選取 [所有列] 作為要擷取的列數。只有在擷取資料庫中的所有列時,才能定義累加式重新整理。

    附註:無法累加範例擷取。

  3. 選取累加式重新整理

  4. 附註:如果啟用「彙總」,則「累加式重新整理」不可用。

  5. 指定資料庫中用於識別新列的欄。

    例如,可以選取新增列至資料庫時單調增加的「日期」欄位或「識別碼」欄。

  6. 展開「進階設定」以確定如何檢索新列。可以選擇透過重新整理等於或大於最後記錄值的值來取代最後新增的列。或者,可以選擇僅重新整理值大於最後記錄值的資料擷取來保留最後新增的列。

  7. 相反地,仍然可以選擇不取代最後新增的列,而僅新增值大於最後記錄值的列。

    附註:新增篩選器後,「累加式重新整理」的「進階設定」將顯示為灰色,並且將強制執行預設設定「不取代最後新增的列」。這樣做的目的是避免某些篩選準則和「取代最後新增的列」的進階累加式重新整理邏輯之間可能出現的任何衝突。

  8. 若要完成,請選取「儲存設定」

上述步驟可用於定義新擷取,或者用於針對累加式重新整理編輯現有擷取。

進行累加式重新整理時的注意事項

編輯擷取

如果要編輯現有擷取,則將顯示上次重新整理,這樣您可以確保使用正確的資料更新擷取。

完整重新整理

每次重新整理擷取時,完整重新整理都會用原始資料來源中的資料取代所有列。完整重新整理可能需要更長的時間,並且對資料庫來說代價高昂。

資料引擎

資料引擎是 Tableau 建立擷取所使用的基礎機制,存放時間值時最多精確到 3 位小數。如果為使用欄識別新列指定日期時間或時間戳記欄,並且您的資料庫使用比 Tableau 更高的精確度,則在累加式重新整理後可能會出現重複列。舉例來說,如果資料庫有兩個列,其中一個列的日期時間值為 2015-03-13 17:30:56.502352,另一個列的日期時間值為 2015-03-13 17:30:56.502852,則 Tableau 在儲存這兩個列時都將使用日期時間值 2015-03-13 17:30:56.502,從而會建立重複列。

查看擷取歷程記錄 (Tableau Desktop)

您可以檢視重新整理擷取的歷史記錄,方法是在 [資料] 功能表中選取資料來源,然後選取 [擷取] > [歷史記錄]

[擷取歷史記錄] 對話方塊將顯示每次重新整理的日期和時間、該重新整理是完全重新整理還是累加式重新整理以及所新增的列數。如果重新整理是從檔執行的,則還將顯示原始檔案的檔案名。

感謝您的意見反應!已成功提交您的意見回饋。謝謝!