在 Web 上建立擷取

可以在 Web 中擷取資料來源(無需使用 Tableau Desktop),以提高資料來源效能並支援其他分析功能。擷取資料來源時,Tableau 會將資料從遠端資料存放區複製到 Tableau Server 或 Tableau Cloud。若要瞭解有關擷取資料之益處的詳情,請參閱擷取資料。在 Web 中,可以在 Web 製作中或內容伺服器中進行擷取。

在 Web 製作中建立擷取

可以使用預設的擷取設定直接在 Web 製作中建立擷取。

在 Web 製作中擷取內嵌資料來源

顯示擷取連線類型的資料來源頁面

完成以下步驟以在 Web 製作中建立擷取。

提示:建議在建立擷取之前完成資料模型。建立擷取可能需要很長時間,並且對資料模型的任何變更(例如,新增新的邏輯資料表)都將使擷取無效。

  1. 選取 Web 製作窗格左下角的「資料來源」索引標籤。對於新工作簿,將在「資料來源」索引標籤中開始。
  2. 在右上角,將連線類型從「即時」變更為「擷取」
  3. 選取「建立擷取」。您將看到「建立擷取」對話方塊。

建立擷取可能會花費很長時間,並且您可以在建立擷取時關閉製作工作階段。為確保建立擷取不會丟失,請在對話方塊中選擇「完成時通知我」,以指定要儲存擷取工作簿的位置。若擷取成功,則工作簿將儲存到指定位置,並且會通知您可以繼續進行 Web 製作工作階段。

若擷取建立失敗,則會通知您無法建立擷取,並且可以透過在 Web 製作中重新開啟原始工作簿來還原未儲存的變更。

定義擷取設定

可以設定以下一個或多個選項來告知 Tableau 如何儲存、定義篩選器並限制擷取中的資料量。

顯示選取邏輯表或實體表的擷取資料頁面

  • 決定應以何種方式儲存擷取資料

    您可以選擇讓 Tableau 使用兩種結構(架構)之一將資料存放在擷取中:邏輯表(非標準化架構)或實體表(標準化架構)。有關邏輯表和實體表的詳情,請參閱 Tableau 資料模型。所選的選項取決於您的需求。

    • 邏輯資料表

      邏輯資料表使用一個擷取表為資料來源中的每個邏輯資料表儲存資料。定義邏輯表的實體表會合併,並與該邏輯表存放在一起。例如,如果資料來源是由單一邏輯表組成,則資料將存放在單一表中。

      如果資料來源是由三個邏輯表組成(每個邏輯表包含多個實體表),則擷取資料會存放在三個表中,每個邏輯表一個。

      當您想使用其他擷取屬性(例如擷取篩選條件、彙總、前 N 個,或其他需要非標準化資料的功能)來限制擷取中的資料量時,請選取「邏輯表」。當您的資料使用直通函數 (RAWSQL) 時,也會使用邏輯表。這是 Tableau 用於存儲擷取資料的預設結構。

      如果在擷取包含聯接時使用此選項,則會在建立擷取時應用聯接。

    • 實體資料表

      實體資料表使用一個擷取表為資料來源中的每個實體資料表儲存資料。

      若擷取由使用一或多個等效聯結合併的表組成,並且滿足下面列出的使用「實體表」選項的條件,請選取「實體表」。如果使用此選項,則會在查詢時執行聯結。

      此選項能夠潛在地提升效能和減小擷取檔案的大小。有關 Tableau 建議如何使用「實體表」選項的詳情,請參閱 Tableau Desktop 說明中的使用「實體表」選項的提示

      在某些情況下,您也可以使用此選項作為列級安全性的解決方法。有關使用 Tableau 的資料列層級安全性的詳情,請參閱 Tableau Desktop 說明中的限制資料列層級的存取權限

      使用「實體表」選項的條件

      若要使用「實體表」選項存放擷取,擷取中的資料必須滿足下面列出的所有條件。

      • 實體資料表之間的所有聯結都是等效 (=) 聯結。
      • 用於關係或聯結的欄的資料類型相同。
      • 未使用傳遞函數 (RAWSQL)。
      • 未設定累加式重新整理。
      • 未設定擷取篩選器。
      • 未設定「前 N 個」或採樣。
      • 擷取儲存為實體資料表時,無法向其附加資料。
      • 對於邏輯資料表,不能將資料附加到具有多個邏輯資料表的擷取。

    附註:「邏輯表」和「實體表」選項都只會影響擷取中資料的存放方式。這些選項不會影響擷取中的資料表在「資料來源」頁面上的顯示方式。

    確定要擷取多少資料 

    選取「新增」可定義一個或多個篩選器,以限制根據欄位及其值擷取的資料量。

    對擷取中的資料進行彙總 

    選取彙總可視維度的資料,以使用度量的預設彙總來彙總度量。對資料進行彙總可以合併列,並且可以最大限度地減少擷取檔案的大小並提高效能。

    選擇彙總資料時,也可以選取將日期匯總到指定的日期層級,例如年、月等。下面的範例會顯示如何為您可以選擇的每個彙總選項擷取資料。

    原始資料每個記錄都顯示為一個單獨列。資料中共有 7 列。
    彙總可視維度的資料

    (無匯總)

    具有相同日期和地區的記錄已彙總到一列中。擷取中共有 5 列。
    彙總可視維度的資料
    (按 [月] 匯總日期)
    日期已按 [月] 層級進行匯總,並且具有相同地區的記錄已彙總到一列中。擷取中共有 3 列。
    • 選取要擷取的列

      選取要擷取的列數。

      可以擷取所有列或前 N 列。Tableau 首先會應用篩選器和彙總,然後從經過篩選和彙總的結果中擷取列數。列數選項取決於要從中進行擷取的資料來源的類型。

      附註:

      • 並非所有資料來源都支援抽樣。因此,您在「擷取資料」對話方塊中可能看不到「取樣」選項。

      • 擷取中將不包括您最初在 [資料來源] 頁面或工作表標籤頁中隱藏的任何欄位。

      設定累加式重新整理設定

      大多數資料來源都支援累加式重新整理。您可以將重新整理設定為僅新增自上次擷取資料以來新增的列,而不是重新整理整個擷取。

      例如,您可能有一個每天都使用新銷售交易進行更新的資料來源。您只需新增當天發生的新交易,而不是每天重新組建整個擷取。要在排程重新整理時將累加式作為選項,必須先定義設定。

      可能需要定期進行完整重新整理以確保擁有最新的資料。

      附註:如果來源資料的資料結構發生變更(例如,新增了列),則需要執行完整的擷取重新整理,然後才能再次開始執行累加式重新整理。

       

設定累加式重新整理

      請依照下列步驟設定要累加式重新整理的擷取,但首先確保您已選取「所有」列作為要擷取的「列」數。

      只有在擷取資料庫中的所有列時,才能定義累加式重新整理。無法遞增樣本擷取。

      1. 選取「累加式重新整理」方塊。

      2. 選擇要重新整理的資料表。

      3. 選取用於識別新列的行。

      4. 「要重新整理的最小日期範圍」中輸入子日期範圍。可以選擇在此欄位中選擇特定的時間範圍(以天、小時、分鐘或秒為單位)。

例如,在 Tableau 中選取「日期」或「日期時間」行後,使用者可以在指定時間範圍內重新整理洩氣資料,比如重新整理日期後的 14 天。此功能對於允許在規定時間段內插入與回溯修改的資料來源非常有用。使用者可使用增量資料擷取重新整理,有效地擷取這些變更以及所有新資料。

 

    使用進階設定

    展開「進階設定」以確定如何檢索新列。

    附註:如果已設定重新整理的最小日期範圍,則無法使用「進階設定」功能。

    「進階設定」可讓您透過重新整理等於或大於最後記錄值的值來取代最後新增的列,或透過僅重新整理具有大於最後記錄值的值的擷取來保留最後新增的列。

      在第一種方法中,Tableau 允許使用者使用非唯一索引鍵資料行(例如日期、日期時間或識別碼)累加式重新整理擷取。

      此方法在執行累加式重新整理時新增了一個新步驟。Tableau 會先刪除擷取中等於之前看到的最高值的列。然後,Tableau 查詢高於或等於先前最高值的所有列,這將挑出所有已刪除的列和任何新列。

      相反地,仍然可以選擇不取代最後新增的列,而僅新增值大於最後記錄值的列。

      若要完成,請選取「建立擷取」

      進行累加式重新整理時的注意事項

      編輯擷取:

      若您正在編輯現有擷取,則會顯示上次重新整理,以便您可以確保使用正確的資料更新擷取。

      完整重新整理:

      每次重新整理擷取時,完整重新整理都會用原始資料來源中的資料取代所有列。完整重新整理可能需要更長的時間,並且對資料庫來說代價高昂。

      資料引擎:

      資料引擎是 Tableau 建立擷取所使用的基礎機制,存放時間值時最多精確到 3 位小數。

      如果為使用欄識別新列指定日期時間或時間戳記欄,並且您的資料庫使用比 Tableau 更高的精確度,則在累加式重新整理後可能會出現重複列。

      例如,如果資料庫有兩列,一列的日期時間值為 2015-03-13 17:30:56.502352,另一列的日期時間值為 2015-03-13 17:30:56.502852,Tableau 將使用日期時間值為 2015-03-13 17:30:56.502 從而建立重複列。

      限制

      • 無法為引用已發佈資料來源的內嵌資料來源建立擷取。因應措施是直接在發行資料來源上建立擷取。有關詳情,請參閱「擷取內容伺服器上的已發佈資料來源」。

      • 無法為基於檔案的資料來源建立擷取。基於檔案的資料來源已經具有特殊的效能特性,而且新增擷取將不具效能優勢。

      • 此功能不適用於 Tableau Cloud 中基於 Bridge 的資料來源。

      • 自訂 SQL 限制:「進階設定」不支援自訂 SQL 查詢。如果依賴自訂 SQL 的使用者希望使用「進階設定」進行累加式重新整理,則需要調整其方法。

在內容伺服器中建立擷取

在內容伺服器上擷取已發佈的資料來源

顯示功能表中擷取選項的資料來源頁面

完成以下步驟以擷取已發佈資料來源。

  1. 以管理員或資料來源擁有者的身分登入。
  2. 在「內容」索引標籤上,選取「探索」,然後選取「資料來源」
  3. 按一下資料來源名稱即可選取資料來源。
  4. 在螢幕頂端的資料來源名稱下方,選取顯示「即時」的下拉式功能表。
  5. 將連線類型從「即時」變更為「擷取」。如果在網站啟用靜態資料擷取加密功能,請選取「加密」「未加密」
  6. 若顯示有關內嵌認證的錯誤訊息,請將認證嵌入至資料來源中。為此,請選擇「編輯連線」。選取「連線中的內嵌密碼」,然後選擇「儲存」

在內容伺服器上擷取內嵌資料來源

資料來源頁面上動作功能表中的擷取選項

完成以下步驟以擷取內嵌在已發佈工作簿中的一個或多個資料來源。

  1. 以管理員或資料來源擁有者的身分登入。
  2. 巡覽至已發佈的工作簿。
  3. 巡覽至「資料來源」索引標籤
  4. 選取一個或多個資料來源。
  5. 選擇「動作」按鈕。
  6. 選取「擷取」。如果在網站啟用靜態資料擷取加密功能,請選取「加密」「未加密」

限制

  • 您的連線認證必須嵌入至資料來源中。
  • 無法為引用已發佈資料來源的內嵌資料來源建立擷取。因應措施是直接在發行資料來源上建立擷取。
  • 無法為基於檔案的資料來源建立擷取。基於檔案的資料來源已經具有特殊的效能特性,而且新增擷取將不具效能優勢。
  • 此功能不適用於 Tableau Cloud 中基於 Bridge 的資料來源。

將擷取資料保持為最新狀態

擷取資料後,可以選擇設定擷取重新整理排程,以將資料保持為最新狀態。有關詳情,請參閱按計劃重新整理資料

監視和管理擷取

伺服器管理員可以在「擷取的背景工作」管理檢視中監視擷取的建立。有關詳情,請參閱擷取背景工作

伺服器管理員可以在「作業」頁面上管理擷取。有關詳情,請參閱在 Tableau Server 中管理背景作業

擷取建立作業(如擷取重新整理作業)在逾時之前具有最大查詢限制。這是為了防止作業永遠執行並使用無限數量的伺服器資源。伺服器管理員可以使用 TSM 命令列介面設定 backgrounder.querylimit 來設定擷取查詢限制逾時。有關詳細資訊,請參閱 tsm configuration set 選項

伺服器管理員可以管理 Web 製作。有關詳情,請參閱設定網站的 Web 製作存取權限和功能

感謝您的意見反應!已成功提交您的意見回饋。謝謝!