資料策略

此內容是 Tableau Blueprint 的一部分,這是一個成熟度架構,可讓您放大並改進組織使用資料推動影響的方式。請使用我們的評估(連結在新視窗開啟)開啟您的旅程。

每個組織對其資料基礎結構都有不同的要求和解決方案。Tableau 尊重組織的選擇,並與您現有的資料策略整合。除了企業資料倉庫之外,組織內部和外部也有許多新的資料來源:雲端應用程式和資料、大數據資料庫、結構化和非結構化存放庫。從 Hadoop 叢集到 NoSQL 資料庫以及許多其他資料庫,不再需要將資料流程集中在做為最終目的地的企業資料倉庫 (EDW)。

現代資料架構受到新業務需求(速度、敏捷性、容量)和新技術的驅動。您可以選擇提供資料的存取,也可以選擇使用其他來源來擴充資料。將此與雲端解決方案相結合,基礎架構和服務可以在數小時內加速資料管道的執行,而您就能以前所未有的方式在組織內移動資料。然而,如果您組織的資料管理手冊是使用傳統的 EDW 單一資料貯體的思維方式撰寫的,很容易錯過新的契機。從存儲段轉移到工作流的技巧是接受並非組織內的所有資料問題都可以由任何資料來源解答。現代資料架構的模式如下所示。

現代資料架構

  1. 原始資料:資料來源,舉例而言,載入到資料平台中的交易資料,通常需要以多種方式進行轉換:清理、PII 檢查等。
  2. 準備計算:原始資料的處理可能需要大量的計算資源,因此比傳統的 ETL 多。資料科學應用程式通常可以發揮作用。這些應用程式實際上可以建立具有高價值的新資料。
  3. 儲存:現代資料平台是依據儲存資料的原理建構而成,因為您永遠不知道未來如何使用。我們逐漸儲存相同資料的中間資料以及多個版本和形式。因此,儲存是分層進行的。
  4. 對於查詢進行運算:典型的分析資料庫引擎,包括 Hyper 資料提取,也包括 Hadoop 等。
  5. 分析:Tableau 就位於分析部分。

Tableau 的混合資料架構

Tableau 的混合資料架構提供兩種資料互動模式:可使用即時連線或記憶體內擷取。這兩者之間的切換就像為您的使用案例選取正確的選項一樣容易。

即時連線

Tableau 的資料連接器會將動態查詢直接傳送到來源資料庫,而不是匯入所有資料,藉以運用您現有的資料基礎結構。這表示,如果您使用快速、經過分析最佳化的資料庫,則可以即時連接資料來發揮使用效益。這會將詳細資料保留在來源系統中,並將查詢的彙總結果傳送到 Tableau。此外,這表示 Tableau 可以有效運用無限量的資料。實際上,Tableau 是世界上許多最大型資料庫的前端分析用戶端。Tableau 對每個連接器進行優化,以運用每個資料來源的獨特特性。

記憶體內擷取

如果您具有依據交易資料庫建構的資料結構,或者希望減少核心資料基礎結構的工作量,則由 Hyper 技術支援的 Tableau 資料引擎將提供針對分析進行優化的記憶體內資料儲存。您可以連接並擷取資料以便儲存在記憶體中,只要按一下即可在 Tableau 中執行查詢。使用 Tableau 資料提取可以減少重新查詢資料庫所花費的時間,盡可能改善使用者體驗。反過來,資料提取能夠讓資料庫伺服器不需處理過多的查詢流量。

對於無法負擔頻繁查詢資源的高活躍度交易系統,資料提取是很好的解決方案。擷取會在每晚重新整理,白天可供使用者使用。資料提取也可以是依據固定記錄數量、總記錄百分比或篩選條件的資料子集合。資料引擎甚至可以執行增量擷取,以新資料更新現有擷取。擷取的用意不是要取代您的資料庫,因此您應該根據分析的需要,將資料提取調整為適當的大小。

如果需要與無法直接存取完整資料來源的使用者共享工作簿,則可以運用擷取。Tableau 封裝的工作簿(.twbx 檔案類型)包含該工作簿使用的所有分析和資料;不僅方便攜帶,而且可與其他 Tableau 使用者共享。

如果使用者使用擷取來發佈工作簿,則該擷取也將發佈到 Tableau Server 或 Tableau Cloud。未來與工作簿的互動將會使用擷取,而不會要求即時資料。如果啟用,則可以設定工作簿要求按排程自動重新整理擷取。

查詢聯合

相關資料儲存在跨越不同資料庫或檔案的表格時,可以使用跨資料庫聯結組合表格。若要建立跨資料庫聯結,您可以在聯結表格之前新增並連線每個不同的資料庫(包括 Excel 和文字檔)建立多連線 Tableau 資料來源。跨資料庫聯結可與即時連線或記憶體內部擷取一起使用。

資料伺服器

隨附在 Tableau Server 和 Tableau Cloud 的資料伺服器可以提供對擷取和共享 Proxy 資料庫連線的共享和集中管理,以便對 Tableau Server 或 Tableau Cloud 的所有使用者提供經過控管、衡量和管理的資料來源,完全不需要在工作簿之間重複擷取或資料連線。

由於多個工作簿可以連接到資料來源,因此可以盡可能減少嵌入式資料來源的擴散,並節省儲存空間和處理時間。有人下載連線到已發佈資料來源而有擷取連線的工作簿時,該次擷取將保留在 Tableau Server 或 Tableau Cloud 上,藉以減少網路流量。最後,如果連線需要資料庫驅動程式,則只需要在 Tableau Server 上安裝驅動程式,不需要在每位使用者的電腦上安裝和維護驅動程式。Tableau Cloud 也一樣,資料庫驅動程式會由 Tableau 針對支援的資料來源加以管理。

使用從每個團隊收集的初始資料使用情況,DBA 和/或資料負責人將對具有適當存取權限的使用者辨識的每個資料來源,發佈經過認證的資料來源。使用者可以直接從 Tableau Desktop 和 Tableau Server 或 Tableau Cloud 連線到已發佈資料來源。

已發佈資料來源可防止擷取和即時連接的資料孤島和不受信任的資料擴散。您可以排定擷取重新整理,讓組織中的使用者維持相同共用資料和定義的最新狀態。可以將已發佈資料來源配置為透過 Proxy 資料庫連線直接連接到即時資料。這表示您的組織可以集中管理資料連接、聯結邏輯、中繼資料和計算的欄位。

同時,為了實現自助服務和彈性,使用者可以透過混合新資料或建立新計算來擴展資料模型,並允許以敏捷的方式將新定義的資料模型交付生產。集中管理的資料不會變更,不過使用者可以維持彈性。

認證資料來源

資料庫管理員和/或資料負責人應證明已發佈資料來源,以便向使用者指示該資料受信任。驗證資料來源在 Tableau Server、Tableau Cloud 和 Tableau Desktop 中均有唯一的認證標記。認證附註可供您說明為什麼可以信任特定資料來源。在檢視此資料來源以及進行驗證時,可以在整個 Tableau 中存取這些說明。認證的資料來源在搜尋結果中獲得優先處理,並在 Tableau Server、Tableau Cloud 和 Tableau Desktop 中的資料來源清單中以醒目方式標示。專案負責人、Tableau Cloud 站台管理員和 Tableau Server/站台管理員有權認證資料來源。如需詳細資訊,請參閱認證資料來源

資料安全性

資料安全性在每個企業中都極為重要。Tableau 可供客戶在現有資料安全性實作基礎上進行建構。IT 管理員可以在有資料庫驗證的資料庫內、在具有權限的 Tableau 內或在兩種混合方法內彈性實作安全性。無論使用者是從 Web、行動裝置或透過 Tableau Desktop 和 Tableau Prep Builder 上發佈的檢視存取的資料,都將強制實施安全性。客戶通常喜歡混合方法,因為可以彈性處理各種使用案例。首先建立資料安全分類,以便定義組織中存在的不同資料類型和敏感度層級。

運用資料庫安全性時,務必注意對於資料庫選擇的驗證方法相當重要。此層級的驗證與 Tableau Server 或 Tableau Cloud 驗證是分開的(也就是說,使用者登入 Tableau Server 或 Tableau Cloud 時,使用者尚未登入資料庫)。這表示,Tableau Server 和 Tableau Cloud 使用者也需要具有認證(這些人本身的使用者名稱/密碼或服務帳戶使用者名稱/密碼)才能連線到資料庫,以便運用資料庫級安全性。為了進一步保護您的資料,Tableau 僅需要資料庫的讀取存取認證,這可以防止發佈者意外變更完整資料。或者,在某些情況下,授予資料庫使用者建立暫存表格的權限相當實用。這可以同時具有效能和安全性優勢,因為暫存資料儲存在資料庫中,而不是 Tableau 中。對於 Tableau Cloud,您需要在資料來源的連線資訊中嵌入認證才可使用自動重新整理。對於 Google 和 Salesforce.com 資料來源,您可以使用 OAuth 2.0 存取權杖形式嵌入認證。

靜態擷取加密是一項資料安全性功能,可讓您在 .hyper 擷取儲存在 Tableau Server 上時對其進行加密。Tableau Server 管理員可以強制加密其站台上的所有擷取,或允許使用者指定加密所有與特定已發佈工作簿或資料來源相關的擷取。有關詳情,請參閱靜態擷取加密

如果您的組織要部署靜態資料擷取加密功能,則可以選擇將 Tableau Server 設定為使用 AWS 作為擷取加密的金鑰管理系統 (KMS)。如要啟用 AWS KMS 或 Azure KMS,您必須在 AWS 或 Azure(視要啟用的 KMS 而定)中部署 Tableau Server,並擁有 Advanced Management for Tableau Server 的授權。在 AWS 中,Tableau Server 會使用 AWS KMS 客戶主金鑰 (CMK) 來產生 AWS 資料金鑰。Tableau Server 使用 AWS 資料金鑰作為所有加密擷取的根主要金鑰。在 Azure 情境中,Tableau Server 會使用 Azure Key Vault 對所有已加密擷取的根主要金鑰 (RMK) 進行加密。不過,即使已針對 AWS KMS 或 Azure KMS 設定整合功能,仍會使用原生 Java 密鑰庫和本機 KMS 在 Tableau Server 上安全地儲存密碼。AWS KMS 或 Azure KMS 僅用於加密已加密擷取的根主金鑰。如需詳細資訊,請參閱金鑰管理系統

在 Tableau Cloud 中,所有資料預設會在靜態時加密。但透過 Advanced Management for Tableau Cloud,即可使用客戶管理的加密金鑰,進一步控制金鑰輪替與稽核作業。客戶管理的加密金鑰功能可讓您使用客戶管理之站台專屬金鑰將站台的資料擷取加密,以提供額外一層安全防護。Salesforce金鑰管理系統 (KMS) 執行個體會為在站台上啟用加密的任何人儲存預設的站台特定加密金鑰。加密程序會遵循金鑰階層。首先,Tableau Cloud 會將擷取加密。接下來,Tableau Cloud KMS 會檢查其金鑰快取,看看是否有合適的資料金鑰。若找不到金鑰,KMS GenerateDataKey API 會使用與該金鑰相關的金鑰原則所授予的權限產生金鑰。AWS KMS 使用 CMK 產生資料金鑰,並傳回純文字和加密版的金鑰到 Tableau Cloud。Tableau Cloud 會利用純文字版的資料金鑰來加密資料,並將加密版的金鑰與已加密的資料儲存在一起。

您可以透過在 Tableau Server 和 Tableau Cloud 中對資料來源設定使用者篩選條件,以限制哪些使用者查看哪些資料。您可以藉以更確實控制使用者根據其 Tableau Server 登入帳戶在已發佈檢視中看見的資料。使用此項技巧後,區域經理可以檢視其區域的資料,不過無法檢視其他區域經理的資料。使用這些資料安全性方法,即可向 Tableau Cloud 或 Tableau Server 上的眾多使用者發佈單一檢視或儀表板,提供安全、個人化的資料和分析。如需詳細資訊,請參閱資料安全限制列層級存取權限。如果列層級安全性對您的分析使用案例至關重要,Tableau Data Management 可讓您使用虛擬連線和資料政策大規模導入使用者篩選功能。如需詳細資訊,請參閱虛擬連線與資料政策

感謝您的意見反應!已成功提交您的意見回饋。謝謝!