可以在 Web 中擷取資料來源(無需使用 Tableau Desktop),以提高資料來源效能並支援其他分析功能。擷取資料來源時,Tableau 會將資料從遠端資料存放區複製到 Tableau Server 或 Tableau Cloud。若要瞭解有關擷取資料之益處的詳情,請參閱擷取資料。在 Web 中,可以在 Web 製作中或內容伺服器中進行擷取。
在 Web 製作中建立擷取
可以使用預設的擷取設定直接在 Web 製作中建立擷取。
在 Web 製作中擷取內嵌資料來源
在 Web 製作中建立擷取:
提示:建議在建立擷取之前完成資料模型。建立擷取可能需要很長時間,並且對資料模型的任何變更(例如,新增新的邏輯資料表)都將使擷取無效。
- 按一下 Web 製作窗格左下角的「資料來源」索引標籤。對於新工作簿,將在「資料來源」索引標籤中開始。
- 在右上角,將連線類型從「即時」變更為「擷取」。
- 按一下「建立擷取」。您將看到「建立擷取」對話方塊。
建立擷取可能會花費很長時間,並且您可以在建立擷取時關閉製作工作階段。為確保建立擷取不會丟失,請在對話方塊中按一下「完成時通知我」,以指定要儲存擷取工作簿的位置。若擷取成功,則工作簿將儲存到指定位置,並且會通知您可以繼續進行 Web 製作工作階段。若擷取建立失敗,則會通知您無法建立擷取,並且可以透過在 Web 製作中重新開啟原始工作簿來還原未儲存的變更。
定義擷取設定
(可選)設定以下一個或多個選項來指示 Tableau 如何儲存、定義篩選器並限制擷取中的資料量:
決定應以何種方式儲存擷取資料
您可以選擇讓 Tableau 使用兩種結構(架構)之一將資料存放在擷取中:邏輯表(非標準化架構)或實體表(標準化架構)。有關邏輯表和實體表的詳情,請參閱 Tableau 資料模型。
所選的選項取決於您的需求。
邏輯表
使用資料來源中每個邏輯表的單一擷取表來存放資料。定義邏輯表的實體表會合併,並與該邏輯表存放在一起。例如,如果資料來源是由單一邏輯表組成,則資料將存放在單一表中。如果資料來源是由三個邏輯表組成(每個邏輯表包含多個實體表),則擷取資料會存放在三個表中,每個邏輯表一個。
當您想使用其他擷取屬性(例如擷取篩選條件、彙總、前 N 個,或其他需要非標準化資料的功能)來限制擷取中的資料量時,請選取「邏輯表」。當您的資料使用直通函數 (RAWSQL) 時,也會使用邏輯表。這是 Tableau 用於存儲擷取資料的預設結構。如果在擷取包含聯接時使用此選項,則會在建立擷取時應用聯接。
實體表
使用資料來源中每個實體表的單一擷取表來存放資料。
若擷取由使用一或多個等效聯結合併的表組成,並且滿足下面列出的使用「實體表」選項的條件,請選取「實體表」。如果使用此選項,則會在查詢時執行聯結。
此選項能夠潛在地提升效能和減小擷取檔案的大小。有關 Tableau 建議如何使用「實體表」選項的詳情,請參閱 Tableau Desktop 說明中的使用「實體表」選項的提示。在某些情況下,您也可以使用此選項作為列級安全性的解決方法。有關使用 Tableau 的資料列層級安全性的詳情,請參閱 Tableau Desktop 說明中的限制資料列層級的存取權限。
使用「實體表」選項的條件
若要使用「實體表」選項存放擷取,擷取中的資料必須滿足下面列出的所有條件。
- 實體資料表之間的所有聯結均為等值 (=) 聯結
- 用於關係或聯結的欄資料類型皆相同
- 未使用直通函數 (RAWSQL)
- 未設定累加式重新整理
- 未設定擷取篩選器
- 未設定「前 N 個」或抽樣
如果以「實體表」方式儲存擷取,則無法向其附加資料。對於邏輯資料表,不能將資料附加到具有多個邏輯資料表的擷取。
附註:「邏輯表」和「實體表」選項都只會影響擷取中資料的存放方式。這些選項不影響擷取中的表在 [資料來源] 頁面上的顯示方式。
確定要擷取多少資料
按一下 [新增] 定義一個或多個篩選器,以限制基於欄位及欄位值擷取的資料量。
對擷取中的資料進行彙總
選取 [彙總可視維度的資料] 以使用度量的預設彙總來彙總度量。對資料進行彙總可以合併列,並且可以最大限度地減少擷取檔案的大小並提高效能。
選取對資料進行彙總時,也可以選取按指定的日期層級(例如 [年] 、 [月] 等)來 [匯總日期] 。下面的範例說明了如何為您可以選取的每個彙總選項擷取資料。
原始資料 每個記錄都顯示為一個單獨列。資料中共有 7 列。 彙總可視維度的資料 (無匯總)
具有相同日期和地區的記錄已彙總到一列中。擷取中共有 5 列。 彙總可視維度的資料
(按 [月] 匯總日期)日期已按 [月] 層級進行匯總,並且具有相同地區的記錄已彙總到一列中。擷取中共有 3 列。 選取要擷取的列
選取要擷取的列數。
可以擷取所有列或前 N 列。Tableau 首先會應用篩選器和彙總,然後從經過篩選和彙總的結果中擷取列數。列數選項取決於要從中進行擷取的資料來源的類型。
附註:
並非所有資料來源都支援抽樣。因此,您在 [擷取資料] 對話方塊中可能看不到 [抽樣] 選項。
擷取中將不包括您最初在 [資料來源] 頁面或工作表標籤頁中隱藏的任何欄位。
限制
- 無法為引用已發佈資料來源的內嵌資料來源建立擷取。因應措施是直接在發行資料來源上建立擷取。有關詳情,請參閱在內容伺服器上擷取已發佈的資料來源。
- 無法為基於檔案的資料來源建立擷取。基於檔案的資料來源已經具有特殊的效能特性,而且新增擷取將不具效能優勢。
- 此功能不適用於 Tableau Cloud 中基於 Bridge 的資料來源。
在內容伺服器中建立擷取
在內容伺服器上擷取已發佈的資料來源
若要擷取發行資料來源:
- 以管理員或資料來源擁有者的身分登入。
- 在「內容」索引標籤上,選取「探索」>「資料來源」。
- 按一下資料來源名稱即可選取資料來源。
- 在螢幕頂端的資料來源名稱下方,選取顯示「即時」的下拉式功能表。
- 將連線類型從「即時」變更為「擷取」。如果在網站啟用靜態資料擷取加密功能,請選取「加密」或「未加密」。
- 若顯示有關內嵌認證的錯誤訊息,請將認證嵌入至資料來源中。若要執行此動作,請按一下「編輯連線」。選取「連線中的內嵌密碼」,然後按一下「儲存」。
在內容伺服器上擷取內嵌資料來源
若要擷取內嵌在已發佈工作簿中的一個或多個資料來源:
- 以管理員或資料來源擁有者的身分登入。
- 巡覽至已發佈的工作簿。
- 巡覽至「資料來源」索引標籤
- 選取一個或多個資料來源。
- 按一下「動作」按鈕。
- 按一下「擷取」。如果在網站啟用靜態資料擷取加密功能,請選取「加密」或「未加密」。
限制
- 您的連線認證必須嵌入至資料來源中。
- 在 Web 中,無法指定擷取設定,如累加式重新整理和擷取篩選條件。
- 無法為引用已發佈資料來源的內嵌資料來源建立擷取。因應措施是直接在發行資料來源上建立擷取。
- 無法為基於檔案的資料來源建立擷取。基於檔案的資料來源已經具有特殊的效能特性,而且新增擷取將不具效能優勢。
- 此功能不適用於 Tableau Cloud 中基於 Bridge 的資料來源。
將擷取資料保持為最新狀態
擷取資料後,可以選擇設定擷取重新整理排程,以將資料保持為最新狀態。有關詳情,請參閱按計劃重新整理資料。
監視和管理擷取
伺服器管理員可以在「擷取的背景工作」管理檢視中監視擷取的建立。有關詳情,請參閱擷取背景工作。
伺服器管理員可以在「作業」頁面上管理擷取。有關詳情,請參閱在 Tableau Server 中管理背景作業。
擷取建立作業(如擷取重新整理作業)在逾時之前具有最大查詢限制。這是為了防止作業永遠執行並使用無限數量的伺服器資源。伺服器管理員可以使用 TSM 命令列介面組態設定 backgrounder.querylimit
來設定擷取查詢限制逾時。有關詳情,請參閱 tsm configuration set 選項。
伺服器管理員可以管理 Web 製作。有關詳情,請參閱設定網站的 Web 製作存取權限和功能。