重新整理擷取

原始資料發生變更時,可以使用 Desktop 重新整理擷取,方法是在「資料」功能表上選取資料來源,然後選取擷取重新整理。資料擷取可以透過兩種方式設定:完整重新整理或累加式重新整理。

透過完整重新整理,資料擷取中的所有資料都將取代為原始資料來源中的最新資訊。累加式重新整理僅新增自上次重新整理以來的新列。如果想了解有關如何擷取資料的更多詳情,可以造訪擷取您的資料頁面

附註:還可以使用 Tableau 資料擷取命令列公用程式自動執行擷取重新整理。有關詳情,請參閱Tableau 資料擷取命令列公用程式

重新整理擷取之前

如果要重新整理擷取,請在執行擷取重新整理之前記下擷取的檔案格式。若使用版本 2022.4.tde 擷取執行重新整理,擷取會自動升級為 .hyper 擷取。雖然升級到 .hyper 擷取有許多好處,但是將無法使用以前版本的 Tableau Desktop 開啟擷取。有關詳情,請參閱擷取升級為 .hyper 格式

附註:Tableau 2024.2 版本之後不再支援任何形式的 .tde 檔案,必須升級為 .hyper 格式才能使用。

設定完整的擷取重新整理

預設情況下,擷取被設定為完全重新整理。這意味著每次重新整理擷取時,所有列都會替換為原始資料來源中的資料。雖然這種重新整理可確保您具有原始資料中的資料的精確副本,但在資料庫上執行完全重新整理有時需要很長時間並且開銷很大,具體取決於擷取的大小。如果未將擷取設定為累加式重新整理,則選取重新整理擷取將會完全重新整理擷取。

發佈到 Tableau Server

如果您打算將擷取作為資料來源發佈到 Tableau Server,則可以在發佈期間指定擷取重新整理排程。

同樣,如果要將工作簿中的擷取發佈到 Tableau Server,則也可以在發佈期間指定擷取重新整理排程。有關詳情,請參閱發佈工作簿時排程擷取重新整理

發佈到 Tableau Cloud

如果打算將擷取以資料來源形式發佈到 Tableau Cloud,則用於重新整理資料的選項取決於您的資料來源的特徵。有關重新整理特定資料來源中的資料的詳細資料,請參閱按資料來源列出的擷取重新整理選項

設定增量擷取重新整理

大多數資料來源都支援累加式重新整理。您可以將重新整理設定為僅新增自上次擷取資料以來新增的列,而不是重新整理整個擷取。

例如,您可能有一個每天都使用新銷售交易進行更新的資料來源。可以新增當天發生的新交易,而不是每天重新建立整個擷取。隨後,為了確保擁有最新-資料,可能需要每週執行一次完整重新整理。

非唯一欄

從版本 2024.1 開始,Tableau 引入了一項功能,讓使用者能夠使用非唯一索引鍵資料行對資料擷取執行累加式重新整理。此更新在此過程中引入了一個額外步驟。

日期範圍(子範圍)重新整理

從版本 2024.2 開始,Tableau 引入了一項新功能,讓使用者能夠指定從來源重新整理資料的特定時間範圍。使用者在設定資料擷取時可以選擇累加式重新整理,並設定重新整理的最小日期範圍。例如,他們可以選擇重新整理從重新整理日期開始的過去 14 天的資料。此功能對於允許在定義的時段內插入和追溯修改的資料來源非常有用,可確保在累加式資料擷取重新整理期間擷取任何變更和新資料。

在沒有設定「要重新整理的最小日期範圍」(即子範圍重新整理)的合格累加式重新整理中,Tableau 最初會從擷取中消除與先前記錄的最高值相符的列。隨後,Tableau 查詢值高於或等於前一個最高值的所有列。此方法可確保所有已刪除的列以及所有新增的列都有納入。

「進階設定」功能提供兩個用於管理資料更新的選項。可以選擇透過重新整理等於或大於最後記錄值的值來取代最後新增的列。或者,可以選擇僅重新整理值大於最後記錄值的資料擷取來保留最後新增的列。

附註:如果來源資料的資料結構發生變更(例如,新增一列),則需要執行完整擷取重新整理,然後才能再次開始執行累加式重新整理。

可以按以下步驟將擷取設定為累加式重新整理。

  1. 「資料」功能表中選取資料來源,然後選取「擷取資料」

  2. 在 [擷取資料] 對話方塊中,選取 [所有列] 作為要擷取的列數。只有在擷取資料庫中的所有列時,才能定義累加式重新整理。

    附註:無法累加範例擷取。

  3. 選取累加式重新整理

  4. 附註:若啟用彙總,則累加式重新整理不可用。

  5. 指定資料庫中用於識別新列的欄。

    例如,可以選取新增列至資料庫時單調增加的「日期」欄位或「識別碼」欄。

  6. (可選)如果在 Tableau 中選取「日期」或「日期時間」欄,則可以透過指定特定日期範圍來執行擷取資料的部分重新整理。確定天數並指定日期/時間刻度,以決定重新整理的最小日期範圍(例如,自重新整理日期起 14 天)。

  7. (可選)如果未建立最小重新整理範圍,請展開「進階設定」以建立如何檢索新列。可以選擇透過重新整理等於或大於最後記錄值的值來取代最後新增的列。或者,可以選擇僅重新整理值大於最後記錄值的資料擷取來保留最後新增的列。

  8. 附註:新增篩選器後,「累加式重新整理」的「進階設定」將顯示為灰色,並且將強制執行預設設定「不取代最後新增的列」。這樣做的目的是避免某些篩選準則和「取代最後新增的列」的進階累加式重新整理邏輯之間可能出現的任何衝突。

  9. 若要完成,請選取「儲存設定」

上述步驟可用於定義新擷取,或者用於針對累加式重新整理編輯現有擷取。

進行累加式重新整理時的注意事項

編輯擷取

若正在編輯現有擷取,則會顯示上次重新整理,以便確保使用正確的資料更新擷取。

完整重新整理

每次重新整理擷取時,完整重新整理都會用原始資料來源中的資料取代所有列。完整重新整理可能需要更長的時間,並且對資料庫來說代價高昂。

資料引擎

資料引擎是 Tableau 建立擷取所使用的基礎機制,存放時間值時最多精確到 3 位小數。如果為使用欄識別新列指定日期時間或時間戳記欄,並且您的資料庫使用比 Tableau 更高的精確度,則在累加式重新整理後可能會出現重複列。舉例來說,如果資料庫有兩個列,其中一個列的日期時間值為 2015-03-13 17:30:56.502352,另一個列的日期時間值為 2015-03-13 17:30:56.502852,則 Tableau 在儲存這兩個列時都將使用日期時間值 2015-03-13 17:30:56.502,從而會建立重複列。

查看擷取歷程記錄 (Tableau Desktop)

您可以檢視重新整理擷取的歷史記錄,方法是在 [資料] 功能表中選取資料來源,然後選取 [擷取] > [歷史記錄]

[擷取歷史記錄] 對話方塊將顯示每次重新整理的日期和時間、該重新整理是完全重新整理還是累加式重新整理以及所新增的列數。如果重新整理是從檔執行的,則還將顯示原始檔案的檔案名。

感謝您的意見反應!已成功提交您的意見回饋。謝謝!