重新整理擷取
當原始資料發生改變時,您可以使用桌面重新整理擷取,方法是在 [資料] 功能表中選取資料來源,然後選取 。可以將擷取設定為完全重新整理,從而將所有資料替換為原始資料來源中的資料;或者設定為累加式重新整理,僅新增自上次重新整理以來新增的列。
附註:您還可以使用 Tableau 資料擷取命令列公用程式自動執行擷取重新整理。有關詳情,請參閱Tableau 資料擷取命令列公用程式。
重新整理擷取之前
如果要重新整理擷取,請在執行擷取重新整理之前記下擷取的檔案格式。若使用版本 2022.4 對 .tde
擷取執行重新整理,擷取會自動升級為 .hyper
擷取。雖然升級到 .hyper
擷取有許多好處,但是將無法使用以前版本的 Tableau Desktop 開啟擷取。有關詳情,請參閱擷取升級為 .hyper 格式。
設定完整的擷取重新整理
預設情況下,擷取被設定為完全重新整理。這意味著每次重新整理擷取時,所有列都會替換為原始資料來源中的資料。雖然這種重新整理可確保您具有原始資料中的資料的精確副本,但在資料庫上執行完全重新整理有時需要很長時間並且開銷很大,具體取決於擷取的大小。如果未將擷取設定為累加式重新整理,則選取重新整理擷取將會完全重新整理擷取。
發佈到 Tableau Server
如果您打算將擷取作為資料來源發佈到 Tableau Server,則可以在發佈期間指定擷取重新整理排程。
同樣,如果您要將工作簿中的擷取發佈到 Tableau Server,則也可以在發佈期間指定擷取重新整理排程。有關詳情,請參閱發佈工作簿時排程擷取重新整理。
發佈到 Tableau Cloud
如果打算將擷取以資料來源形式發佈到 Tableau Cloud,則用於重新整理資料的選項取決於您的資料來源的特徵。有關重新整理特定資料來源中的資料的詳細資料,請參閱按資料來源列出的擷取重新整理選項。
附註:如果使用 Tableau Cloud,則必須先在 Tableau Desktop 中建立擷取,然後將其重新發佈到 Tableau Cloud。
設定增量擷取重新整理
大多數資料來源都支援累加式重新整理。您可以將重新整理設定為僅新增自上次擷取資料以來新增的列,而不是重新整理整個擷取。例如,您可能有一個每天都使用新銷售交易進行更新的資料來源。您只需新增當天發生的新交易,而不是每天重新組建整個擷取。隨後,為了確保擁有最新資料,您可能需要每週執行一次完全重新整理。
附註:如果來源資料的資料結構發生變更(例如,新增了列),則需要執行完整的擷取重新整理,然後才能再次開始執行累加式重新整理。
你可以按以下步驟將擷取設定為累加式重新整理。
在 [資料] 功能表中選取資料來源,然後選取 [擷取資料] 。
在 [擷取資料] 對話方塊中,選取 [所有列] 作為要擷取的列數。只有在擷取資料庫中的所有列時,才能定義累加式重新整理。無法遞增樣本擷取。
選取 [累加式重新整理] ,然後在資料庫中指定將用於標識新列的欄。例如,如果選取 [日期] 欄位,則重新整理將會新增日期晚於上次重新整理日期的所有列。或者,也可以使用 [ID] 欄,該欄將隨新增到資料庫中的列而遞增。
附註:每次重新整理擷取時,完整重新整理都會用原始資料來源中的資料取代所有列。完整重新整理可能需要更長的時間,並且對資料庫來說代價高昂。
附註:資料引擎是 Tableau 建立擷取所使用的基礎機制,存儲時間值時最多精確到 3 位小數。如果為 [使用欄標識新列] 指定日期時間或時間戳記欄,並且資料庫使用比 Tableau 更高的精度,則在累加式重新整理後最終會出現重複列。舉例來說,如果資料庫有兩個列,其中一個列的日期時間值為
2015-03-13 17:30:56.502352
,另一個列的日期時間值為2015-03-13 17:30:56.502852
,則 Tableau 在儲存這兩個列時都將使用日期時間值2015-03-13 17:30:56.502
,從而會建立重複列。完成後,按一下 [擷取] 。
上述步驟可用於定義新擷取,或者用於針對累加式重新整理編輯現有擷取。如果要編輯現有擷取,則將顯示上次重新整理,這樣您可以確保使用正確的資料更新擷取。
參閱擷取歷程記錄
您可以檢視重新整理擷取的歷史記錄,方法是在 [資料] 功能表中選取資料來源,然後選取 。
[擷取歷史記錄] 對話方塊將顯示每次重新整理的日期和時間、該重新整理是完全重新整理還是累加式重新整理以及所新增的列數。如果重新整理是從檔執行的,則還將顯示原始檔案的檔案名。