Tableau Data Management
此內容是 Tableau Blueprint 的一部分,這是一個成熟度架構,可讓您放大並改進組織使用資料推動影響的方式。請使用我們的評估(連結在新視窗開啟)開啟您的旅程。
Tableau Data Management 可協助您更確實地管理您分析環境中的資料,確保您隨時使用可信任的最新資料來推動決策。從資料準備到編目、搜尋和控管,Tableau Data Management 能夠讓您更加信任您的資料,同時加速自助服務分析的採用。這項服務是個別授權的功能集合,其中包括用於管理 Tableau Server 和 Tableau Cloud 中的 Tableau 內容和資料資產所用的 Tableau Prep Conductor 和 Tableau Catalog。
何謂 Tableau Data Management?
整體而言,您的組織將受益於 Tableau Blueprint 中其他地方討論的資料控管和資料來源管理方法。除了這些方法之外,您還會經常在資料庫、資料分析和視覺效果社群中聽到對術語「Data Management(資料管理)」的泛型引用。然而,當涉及具有 Tableau Data Management(一組與 Tableau Server 和 Tableau Cloud 結合使用的功能)的 Tableau 時,此術語會變得更加具體。無論您使用的是 Windows 版、Linux 版 Tableau Server 或 Tableau Cloud,Tableau Data Management 的功能大多相同(一小部分功能可能僅在 Tableau Cloud 或 Tableau Server 中可用)。
Tableau Data Management 包含一組工具,可協助您組織的資料負責人和分析員管理 Tableau 環境中的資料相關內容和資產。具體來說,當您購買 Tableau Data Management 時,會新增三個附加功能集:
Tableau Catalog
Tableau Prep Conductor
具有資料原則的虛擬連線
Tableau Catalog
Tableau Catalog 是 Tableau Data Management 的原始功能,它提供的功能可幫助簡化對 Tableau 資料來源的存取、瞭解和信任。Tableau Catalog 專注於歷程、資料品質、搜尋和影響分析等領域,可讓資料負責人和資料視覺效果人員/分析員更輕鬆地瞭解和信任 Tableau Server 和 Cloud 中的資料來源。Tableau Catalog 可透過 Tableau REST API 中的中繼資料方法為 Tableau 開發人員提供其他功能。
最初啟用 Tableau Catalog 時,它會掃描 Tableau Server 或 Cloud 站台中的所有相關內容項目,以建立所有相關物件的連線檢視(Tableau Catalog 將此稱為內容中繼資料)。這會將搜尋功能擴充到資料連線之外。資料負責人和視覺化作者也可以根據欄、資料庫和資料表進行搜尋。
為減少無意中修改或刪除另一個物件所依賴物件的可能性(例如,重新命名或移除對生產工作簿至關重要的資料庫欄),Tableau Catalog 的歷程功能可公開 Tableau 站台上所有內容(包括指標、流程、虛擬連線)之間的相互關係。現在您可以輕鬆查看物件之間的關係,並在進行變更之前分析待處理變更的影響。
為提高對 Tableau 資料來源的信任,Tableau Catalog 可提供補充資訊,例如擴充的資料相關物件描述、資料詳細資訊檢視以及用於增強搜尋彈性的關鍵字標記。驗證資料來源會在資料來源旁邊放置一個顯著的圖示,以表示資料來源擁有者或管理員對資料來源的信任。可能引起取用者關注的資料項目(資料來源、欄等),例如已棄用或過時資料,可以指定具有資料品質警告。除了資料品質警告選項之外,還可以使用敏感度標籤專門標幟敏感資料。
Tableau Prep Conductor
若您像許多 Tableau 客戶一樣,您已經發現 Tableau Prep Builder 的優勢在於建立複雜的資料準備「流程」,這些流程可合併多個資料來源、調整資料、自訂欄以及輸出為一種或多種所需的資料格式。但是,一旦建立完美的 Prep 流程後,如何讓其自動化執行並按排程對資料來源進行完整或累加式更新?
這就是資料管理的另一個功能 Tableau Prep Conductor 發揮作用的地方。Tableau Prep Conductor 允許靈活地排程 Tableau Prep 流程,無論它們是從 Tableau Prep Builder 發佈到 Tableau Server 或 Tableau Cloud 環境,還是透過 Prep 流程 Web 製作直接在瀏覽器中建立。首先測試基於 Web 的流程(可以在沒有資料管理的情況下手動隨需執行流程,但需要購買資料管理來排程流程透過 Prep Conductor 自動執行)。在排程之前,流程應執行完成並建立所需的輸出資料來源,且未發生錯誤。
若您使用 Tableau Server,您的管理員(或者您,若您有適當的權限)可以建立自訂排程(例如「每天午夜」、「週日中午」等)來執行 Prep 流程,就像您可能已經為擷取重新整理建立排程一樣。
若您使用 Tableau Cloud,預設會安裝一組預先定義的 Prep 流程排程。您無法自訂這些排程或建立您自己的 Prep 流程排程。
排程要從「動作」功能表執行的流程。A 單一工作排程將僅按照您選取的排程執行選取的 Prep 流程。A 若您希望「鏈結」多個流程以特定順序執行(可能為建立一個資料來源輸出,以用作後續流程的輸入資料來源),連結工作排程將允許您選取一個或多個其他流程,以與選定的流程按順序執行。這些流程現在將按排程執行,同時自動更新或建立 Tableau 工作簿可能依據的資料來源。
除了排程流程的功能之外,資料管理和 Tableau Prep Conductor 還新增了一些選項來監視已排程流程是否成功/失敗、在流程排程成功或失敗時傳送電子郵件通知、使用 Tableau Server/Cloud REST API 以程式設計方式執行流程,並受益於監視流程效能歷程記錄的附加管理檢視功能。
最佳做法建議:若您打算在 Tableau Server 上執行大量 Tableau Prep Conductor 流程,您可能需要調整伺服器環境的擴充功能。如有必要,可透過新增額外節點或背景程式流程來對 Tableau Server 系統進行效能調整,以適應所需的 Prep 流程負載。
Tableau Cloud 有何功能?雖然您不需要為 Prep 流程容量考慮變更 Tableau Cloud 的架構,但您需要為您想要排程的每個同時 Tableau Prep Conductor 流程取得一個資源區塊(Tableau Cloud 計算能力的單位)。確定您需要多少個同時流程排程,並相應地購買 Tableau Cloud 資源區塊。
虛擬連線
現在進入我們的下一個資料管理功能 - 虛擬連線。虛擬連線可提供資料的集中存取點。它可以跨多個資料庫存取多個資料表。虛擬連線可讓您在連線層級的一個地方管理擷取資料和安全性。
虛擬連線何時有用?
若您考慮在 Tableau 中使用與多個工作簿共用資料庫連線的傳統方式,您可能會考慮直接連線到 SQL Server 或 Snowflake 等資料庫伺服器、提供資料庫登入認證、新增並聯結一個或多個資料表,然後將資料來源發佈到 Tableau Server 或 Tableau Cloud。雖然您可以選擇將此用作資料的即時連線,但您很可能希望從資料來源中擷取資料,以加快已連線工作簿的速度。
為方便討論,我們考慮您可能多次執行上述動作,以適應不同的資料表或聯結集,從而產生用於一系列工作簿的多個已發佈資料來源(可能還包括擷取資料來源),這些工作簿具有不同的資料表/連線要求,但都使用相同的初始資料庫。
現在,讓我們考慮一下,若該系列資料來源中引用的初始 SQL Server 或 Snowflake 資料庫的某些內容發生變更(可能是重新命名資料表、新增其他欄位或變更資料庫認證),會發生什麼情況。您現在面臨的工作是開啟每個先前建立的資料來源,進行必要的變更以適應資料庫變更,然後重新發佈(可能還需要重新排程擷取重新整理)。
您可能會發現僅建立一個儲存資料庫伺服器名稱、認證和資料表引用的初始資料連線「定義」要簡單得多。而且,您可能更喜歡從更大的「定義」中擷取資料。然後,當您需要為資料表、聯結等的各種組合建立不同的資料來源時,可以引用該初始「定義」,而不是直接連線到一個或多個資料庫伺服器。若核心資料庫結構中的某些內容發生變更(例如,資料表名稱變更或認證被修改),您只需修改初始「定義」物件,所有依賴的資料來源都會自動繼承變更。
資料管理功能透過虛擬連線引入這種共用「定義」功能。虛擬連線與標準資料來源連線類似,可儲存資料庫伺服器、登入認證和選定的資料表。而且,與傳統的 Tableau 資料來源一樣,虛擬連線可以包含與多個資料庫/資料來源的連線(每個資料庫/資料來源都有自己的一組認證和資料表)。雖然虛擬連線中允許進行某些中繼資料修改(例如,隱藏或重新命名欄位),但資料表不會在虛擬連線內聯結。當您最終使用虛擬連線作為工作簿的直接來源或作為其他已發佈資料來源的連線類型時,可以聯結資料表,並進一步自訂資料來源。
建立虛擬連線並將其發佈到 Tableau Server 或 Tableau Cloud 以及設定適當的權限後,可以像連線到任何其他資料來源一樣連線到 Tableau Desktop 或 Tableau Server/Cloud 中的虛擬連線。但是,您不需要指定資料庫伺服器位置或提供認證,並且您將立即能夠聯結資料表,然後視覺化資料或發佈資料來源。
資料原則
除了前面所述的集中式資料庫連線功能之外,Tableau Data Management 虛擬連線還可透過資料原則提供更簡化的集中式列層級安全性選項。使用資料原則將列層級安全性應用於虛擬連線中的一或多個表。資料原則會篩選資料,確保使用者只看到他們應該看到的資料。資料原則適用於即時連線和擷取連線。
資料原則何時有用?
在許多組織中,常見的是自動將視覺效果中可見的資料限制為僅適用於目前使用者的資料。例如,讓我們考慮一個共用儀表板,其中包含交叉表物件中的訂單詳細資訊。
若您是大區域的銷售經理,詳細資訊交叉表將顯示您區域內每位客戶主管的訂單。
但是,若您是個人客戶主管,則詳細資訊交叉表將僅顯示您客戶的訂單。
此情境需要在 Tableau 環境中實作列層級安全性,這可以透過以下幾種方法之一來完成,包括:
資料庫中的列層級安全性。每次檢視視覺效果效果時,系統都會提示檢視者使用自己的認證或從其 Tableau 使用者帳戶繼承的認證登入基礎資料庫。產生的資料集僅限於根據提供的認證允許他們查看的資料。由於每個檢視者都需要維護自己的認證,這不僅會很快變得乏味,而且即時資料連線可能會給基礎資料庫帶來很大的負擔,從而影響效能。此外,Tableau Cloud 可能會限制將認證傳遞到即時連線的某些選項。
Tableau 使用者篩選器。在工作簿中建立個別工作表時會套用使用者篩選器。透過指定個別 Tableau 使用者認證或一個或多個 Tableau 使用者群組中的成員資格的組合,可以篩選個別工作表以僅顯示與該使用者相關的資料。這可能會變得乏味,因為工作簿中的每個個別工作表都需要提供使用者篩選器,無法透過一個流程對大型工作簿群組指定使用者篩選器。此外,若使用者無意中取得工作簿的編輯權限,他們可能會輕鬆地將使用者篩選器拖離篩選器架,並查看他們可能沒有權限檢視的所有完整資料。
透過使用 Tableau 計算語言的子集,資料原則可以指定複雜的原則(可能透過使用資料庫中的相關「權利表」)來根據使用者 ID 或群組成員資格自訂和限制虛擬連線傳回的資料。這不僅可以在資料來源層級維護列層級安全性(連線到資料來源的所有工作簿將自動繼承安全性並採用虛擬連線內所做的任何變更),還可以將資料原則的任何修改僅限為對原始虛擬連線具有編輯權限的人員,從而新增額外的一層安全性。