可以在 Web 中擷取資料來源(無需使用 Tableau Desktop),以提高資料來源效能並支援其他分析功能。擷取資料來源時,Tableau 會將資料從遠端資料存放區複製到 Tableau Server 或 Tableau Cloud。若要瞭解有關擷取資料之益處的詳情,請參閱擷取資料。在 Web 中,可以在 Web 製作中或內容伺服器中進行擷取。

在 Web 製作中建立擷取

可以使用預設的擷取設定直接在 Web 製作中建立擷取。

在 Web 製作中擷取內嵌資料來源

顯示擷取連線類型的資料來源頁面

在 Web 製作中建立擷取:

提示:建議在建立擷取之前完成資料模型。建立擷取可能需要很長時間,並且對資料模型的任何變更(例如,新增新的邏輯資料表)都將使擷取無效。

  1. 按一下 Web 製作窗格左下角的「資料來源」索引標籤。對於新工作簿,將在「資料來源」索引標籤中開始。
  2. 在右上角,將連線類型從「即時」變更為「擷取」
  3. 按一下「建立擷取」。您將看到「建立擷取」對話方塊。

建立擷取可能會花費很長時間,並且您可以在建立擷取時關閉製作工作階段。為確保建立擷取不會丟失,請在對話方塊中按一下「完成時通知我」,以指定要儲存擷取工作簿的位置。若擷取成功,則工作簿將儲存到指定位置,並且會通知您可以繼續進行 Web 製作工作階段。若擷取建立失敗,則會通知您無法建立擷取,並且可以透過在 Web 製作中重新開啟原始工作簿來還原未儲存的變更。

定義擷取設定

顯示選取邏輯表或實體表的擷取資料頁面

(可選)設定以下一個或多個選項來指示 Tableau 如何儲存、定義篩選器並限制擷取中的資料量:

  • 決定應以何種方式儲存擷取資料

    您可以選擇讓 Tableau 使用兩種結構(架構)之一將資料存放在擷取中:邏輯表(非標準化架構)或實體表(標準化架構)。有關邏輯表和實體表的詳情,請參閱 Tableau 資料模型

    所選的選項取決於您的需求。

    • 邏輯表

      使用資料來源中每個邏輯表的單一擷取表來存放資料。定義邏輯表的實體表會合併,並與該邏輯表存放在一起。例如,如果資料來源是由單一邏輯表組成,則資料將存放在單一表中。如果資料來源是由三個邏輯表組成(每個邏輯表包含多個實體表),則擷取資料會存放在三個表中,每個邏輯表一個。

      當您想使用其他擷取屬性(例如擷取篩選條件、彙總、前 N 個,或其他需要非標準化資料的功能)來限制擷取中的資料量時,請選取「邏輯表」。當您的資料使用直通函數 (RAWSQL) 時,也會使用邏輯表。這是 Tableau 用於存儲擷取資料的預設結構。如果在擷取包含聯接時使用此選項,則會在建立擷取時應用聯接。

    • 實體表

      使用資料來源中每個實體表的單一擷取表來存放資料。

      若擷取由使用一或多個等效聯結合併的表組成,並且滿足下面列出的使用「實體表」選項的條件,請選取「實體表」。如果使用此選項,則會在查詢時執行聯結。

      此選項能夠潛在地提升效能和減小擷取檔案的大小。有關 Tableau 建議如何使用「實體表」選項的詳情,請參閱 Tableau Desktop 說明中的使用「實體表」選項的提示。在某些情況下,您也可以使用此選項作為列級安全性的解決方法。有關使用 Tableau 的資料列層級安全性的詳情,請參閱 Tableau Desktop 說明中的限制資料列層級的存取權限

      使用「實體表」選項的條件

      若要使用「實體表」選項存放擷取,擷取中的資料必須滿足下面列出的所有條件。

      • 實體資料表之間的所有聯結均為等值 (=) 聯結
      • 用於關係或聯結的欄資料類型皆相同
      • 未使用直通函數 (RAWSQL)
      • 未設定累加式重新整理
      • 未設定擷取篩選器
      • 未設定「前 N 個」或抽樣

      如果以「實體表」方式儲存擷取,則無法向其附加資料。對於邏輯資料表,不能將資料附加到具有多個邏輯資料表的擷取。

    附註:「邏輯表」和「實體表」選項都只會影響擷取中資料的存放方式。這些選項不影響擷取中的表在 [資料來源] 頁面上的顯示方式。

  • 確定要擷取多少資料 

    按一下 [新增] 定義一個或多個篩選器,以限制基於欄位及欄位值擷取的資料量。

  • 對擷取中的資料進行彙總 

    選取 [彙總可視維度的資料] 以使用度量的預設彙總來彙總度量。對資料進行彙總可以合併列,並且可以最大限度地減少擷取檔案的大小並提高效能。

    選取對資料進行彙總時,也可以選取按指定的日期層級(例如 [年] 、 [月] 等)來 [匯總日期] 。下面的範例說明了如何為您可以選取的每個彙總選項擷取資料。

    原始資料每個記錄都顯示為一個單獨列。資料中共有 7 列。
    彙總可視維度的資料

    (無匯總)

    具有相同日期和地區的記錄已彙總到一列中。擷取中共有 5 列。
    彙總可視維度的資料
    (按 [月] 匯總日期)
    日期已按 [月] 層級進行匯總,並且具有相同地區的記錄已彙總到一列中。擷取中共有 3 列。
  • 選取要擷取的列

    選取要擷取的列數。

    可以擷取所有列 N 列。Tableau 首先會應用篩選器和彙總,然後從經過篩選和彙總的結果中擷取列數。列數選項取決於要從中進行擷取的資料來源的類型。

    附註:

    • 並非所有資料來源都支援抽樣。因此,您在 [擷取資料] 對話方塊中可能看不到 [抽樣] 選項。

    • 擷取中將不包括您最初在 [資料來源] 頁面或工作表標籤頁中隱藏的任何欄位。

限制

  • 無法為引用已發佈資料來源的內嵌資料來源建立擷取。因應措施是直接在發行資料來源上建立擷取。有關詳情,請參閱在內容伺服器上擷取已發佈的資料來源
  • 無法為基於檔案的資料來源建立擷取。基於檔案的資料來源已經具有特殊的效能特性,而且新增擷取將不具效能優勢。
  • 此功能不適用於 Tableau Cloud 中基於 Bridge 的資料來源。

在內容伺服器中建立擷取

在內容伺服器上擷取已發佈的資料來源

顯示功能表中擷取選項的資料來源頁面

若要擷取發行資料來源:

  1. 以管理員或資料來源擁有者的身分登入。
  2. 在「內容」索引標籤上,選取「探索」>「資料來源」
  3. 按一下資料來源名稱即可選取資料來源。
  4. 在螢幕頂端的資料來源名稱下方,選取顯示「即時」的下拉式功能表。
  5. 將連線類型從「即時」變更為「擷取」。如果在網站啟用靜態資料擷取加密功能,請選取「加密」「未加密」
  6. 若顯示有關內嵌認證的錯誤訊息,請將認證嵌入至資料來源中。若要執行此動作,請按一下「編輯連線」。選取「連線中的內嵌密碼」,然後按一下「儲存」

在內容伺服器上擷取內嵌資料來源

資料來源頁面上動作功能表中的擷取選項

若要擷取內嵌在已發佈工作簿中的一個或多個資料來源:

  1. 以管理員或資料來源擁有者的身分登入。
  2. 巡覽至已發佈的工作簿。
  3. 巡覽至「資料來源」索引標籤
  4. 選取一個或多個資料來源。
  5. 按一下「動作」按鈕。
  6. 按一下「擷取」。如果在網站啟用靜態資料擷取加密功能,請選取「加密」「未加密」

限制

  • 您的連線認證必須嵌入至資料來源中。
  • 在 Web 中,無法指定擷取設定,如累加式重新整理和擷取篩選條件。
  • 無法為引用已發佈資料來源的內嵌資料來源建立擷取。因應措施是直接在發行資料來源上建立擷取。
  • 無法為基於檔案的資料來源建立擷取。基於檔案的資料來源已經具有特殊的效能特性,而且新增擷取將不具效能優勢。
  • 此功能不適用於 Tableau Cloud 中基於 Bridge 的資料來源。

將擷取資料保持為最新狀態

擷取資料後,可以選擇設定擷取重新整理排程,以將資料保持為最新狀態。有關詳情,請參閱按計劃重新整理資料

監視和管理擷取

伺服器管理員可以在「擷取的背景工作」管理檢視中監視擷取的建立。有關詳情,請參閱擷取背景工作

伺服器管理員可以在「作業」頁面上管理擷取。有關詳情,請參閱在 Tableau Server 中管理背景作業

擷取建立作業(如擷取重新整理作業)在逾時之前具有最大查詢限制。這是為了防止作業永遠執行並使用無限數量的伺服器資源。伺服器管理員可以使用 TSM 命令列介面組態設定 backgrounder.querylimit 來設定擷取查詢限制逾時。有關詳情,請參閱 tsm configuration set 選項

伺服器管理員可以管理 Web 製作。有關詳情,請參閱設定網站的 Web 製作存取權限和功能

感謝您的意見回饋!