連線到資料來源

Tableau 支援者倡議使用 Tableau Server 的其中一個主要原因就是它能夠實現協作。當您的組織在轉變為使用 Tableau Server 時,對於您和您的使用者來說,一個重要的概念轉變就是您如何看待共用工作簿…以及工作簿說明您分析的資料。

從 Tableau Server 的角度考慮資料

如果您僅使用 Tableau Desktop,則可以管理您自己的所有資料連線。例如,您可能會開啟 Tableau,連線到 SQL Server,然後選取要使用的資料庫、表和列。或者,您或許會連線到 Excel 試算表並選取要分析的工作表。通常,您不會考慮打算如何與他人共用資料。事實上,我們都犯的一個新手級錯誤就是根據本機 Excel 檔建立工作簿,將工作簿另存新檔為 .twb 檔案,然後透過電子郵件將該工作簿傳送出去供其他人欣賞。但是,他們當然什麼都看不到,因為您透過電子郵件傳送的工作簿實際上無法到達您的本機 Excel 檔案。

既然您已經安裝了 Tableau Server,那麼您和您的使用者就必須瞭解考慮工作簿和資料的不同方式。使用者自然而然地會透過將其工作簿發佈到 Tableau Server 來共用工作簿。但是您和他們也要想想如何共用這些工作簿使用的資料。

向您的使用者提供 Tableau Server 之後,您可以透過以下一些方法共用資料:

  • 建立和發佈已封裝工作簿,這些工作簿包含在 Tableau Desktop 中建立的擷取。其他使用者可以使用這些工作簿以及擷取中的靜態資料。

  • 發佈資料來源,該資料來源定義資料庫連線並且包括有關要使用該資料庫中的哪些資料的資訊。然後,使用者可以建立指向其資料的此來源的工作簿。

考慮優化資料存取和安全性

除了考慮可以共用資料存取的方法之外,您和您的使用者還必須瞭解如何最有效地利用資料。首先,利用 Tableau Server 優化資料存取可能看上去很複雜。Tableau 支援許多資料連接器。每個連接器均針對它所連線到的資料進行了優化,而且每個連接器都具有不同的特點。許多連接器具有不同的驗證要求。有些連接器不允許擷取。有些連接器支援大量的查詢篩選和操作,而其他連接器提供的支援則更加有限。

當您熟悉 Tableau Server 並瞭解如何針對您的情況優化資料存取後,您的使用者將發現以下好處:

  • 效能。目標是 [流程] 。當使用者正在執行資料分析流程時,以不同方式處理資料可以說明他們獲得更深入的瞭解。您需要設定資料存取,以便盡可能不中斷使用者的流體驗。

  • 資料存取。對於許多組織,執行適當的資料存取對於業務至關重要。作為 Tableau Server 管理員,您可以確保使用者具有的資料存取權限滿足您的組織的驗證和隱私要求。

  • 資料的單一來源。您可以使用 Tableau Server 在您的組織中改進資料的一致性。您可以管理資料來源連線並建立擷取重新整理排程,以滿足使用者的需要,並確定穩定且一致的資料使用方式。

開始之前

我們已經為負責 Tableau Server 管理工作的 Tableau Desktop 支援者編寫了本章。因此,我們假設您瞭解資料即時連線(如 SQL Server 或像 Amazon Redshift 這樣的雲端解決方案)與擷取之間的差異。您應該熟悉下列術語和概念:

  • 資料來源。到資料庫或其他資料存儲位置的連線,其中包含該資料庫中要使用的資料的資訊。使用者可以建立指向資料來源的工作簿。在 Tableau Server 上共用的資料來源可能包含擷取,或者它可能包含描述如何存取即時連線的設定資訊。

  • 擷取。這是資料快照。可以利用像 Excel 試算表這樣的靜態資料來源來建立擷取(.tde.hyper 檔案)。或者擷取可能包含來自關聯式資料庫或來自基於雲端的資料的資料。可以將 Tableau Server 上共用的擷取設定為按照您定義的排程從基礎資料進行重新整理。

  • 即時連線。這是指包含基礎資料直接連線的資料來源,可提供即時或接近即時的資料。借助即時連線,Tableau 可直接針對資料庫或其他來源進行查詢,並返回查詢結果以在工作簿中使用。使用者可以建立即時連線,然後在 Tableau Server 上共用這些連線,以便其他 Tableau 使用者可以透過相同的連線和篩選設定來使用相同的資料。作為 Tableau Server 管理員,您可以管理認證以及與資料來源關聯的權限以控制使用者可以存取的資料。

  • 執行身分使用者。這是 Tableau Server 存取組織中的資料所使用的 Windows 帳戶。我們在排程和安裝章節中討論了此使用者帳戶。執行身分使用者帳戶可以用作 Tableau Server 獲取資料所使用的 Windows 帳戶。如果您的使用者需要存取來自共用檔(如共用的 Excel 試算表)、Microsoft SQL Server、Oracle 資料庫或其他使用 Windows 驗證的資料來源的資料,則此帳戶很重要。

如果您還不熟悉這些不同的資料存取術語,請花一些時間通讀 Tableau 說明中的發佈資料來源和工作簿(Link opens in a new window)。若要更新您對 Tableau Server 如何使用執行身分使用者帳戶存取資料的理解,請檢視本指南前面的排程您的部署

您需要執行的操作

Tableau Server:通用安裝導引 的這一章論述了在 Tableau Server 上開始擔任資料管理員新角色所必須執行的三個基本步驟:

  1. 提供資料來源存取權限。

  2. 加深您對使用即時連線和擷取之間的折衷方案的理解。

  3. 測試即時連線與擷取之間可能存在的效能差異。

提供資料來源存取權限

若要提供資料來源的存取權限,首先需要瞭解各種資料來源處理驗證的方式 - 即登入。大多數情況下,在使用者存取資料之前,資料庫、雲端資料和多維資料集要求使用者進行驗證。驗證的詳細資料為每個連接器所特有,驗證由每個連接器進行處理。

作為管理員,您可能需要使資料存取與組織中的資料庫管理員或資料團隊保持協調。如果你們是資料團隊,則需要瞭解您的組織所使用的資料以及他們堅持的驗證要求。例如,當 Tableau 使用者連線到 MySQL 時,需要進行 Windows 驗證才能存取。適用於 Windows 的 Tableau Desktop 上的使用者不會得到提示。但是,如果使用者使用 Mac,則當他們嘗試連線時,MySQL 的 Tableau Desktop 連接器會提示 Mac 使用者輸入認證。

如果可能,我們會建議採用每使用者驗證來存取資料。然而,在某些情況下,可以使用執行身分使用者帳戶來存取資料庫或檔共用。SQL Server 就是一個範例。如果使用者發佈一個使用 SQL Server 即時連線(不是擷取連線)的工作簿,則當其他使用者存取該工作簿時,Tableau Server 將自動使用執行身分使用者帳戶。這意味著,當另一個使用者開啟該工作簿時,該使用者對資料的存取由您作為管理員為執行身分使用者帳戶提供的存取權限來確定。

排程您的部署一章中所討論的那樣,我們建議您設定執行身分使用者帳戶,以進行 [最低權限] 存取。在大多數情況下,這意味著對帳戶將存取的資料來源進行唯讀存取。

允許(或不允許)使用者嵌入認證

作為管理員,您可以決定允許使用者在他們發佈到伺服器的工作簿和資料來源中嵌入(加密的)密碼。在這種情況下,當其他人使用這些工作簿或資料來源時,他們可以看到資料,而無需提供認證。

若要啟用或停用內嵌認證,請登入到 Tableau Server。

在網站功能表中,按一下 [管理所有網站] ,然後依次按一下 [設定] > [常規] 索引標籤。

選中或清除 [允許發佈者將認證嵌入工作簿或資料來源中] 選項。

這是伺服器範圍的設定 - 您在此處進行的設定適用於所有網站上的所有工作簿。

我們應該注意到,在一些情況下內嵌認證無意中可能會為不應該看到資料的使用者提供存取權限。因此,對於需要使用者層級資料庫驗證的組織,我們建議停用內嵌認證。以後,當使用者開啟從要求驗證的來源獲取資料的工作簿、資料連線、檢視或儀表板時,會提示使用者輸入認證。

另一方面,一些組織使用 Tableau Server 作為資料分析師的單一託管入口點。在此情況下,嵌入認證可能具有商業意義 - 需要存取資料庫的所有 Tableau 使用者都可以使用嵌入在工作簿或資料來源中的一組認證。

設定資料來源權限

透過將資料來源發佈到 Tableau Server,團隊中的人員可以提供對資料的集中式存取。這樣,可以在使用者之間共用資料,包括在那些不使用 Tableau Desktop 但有權在 Web 編輯環境中編輯工作簿的使用者之間共用。使用 Tableau Desktop 的使用者可以發佈包含擷取或即時連線的資料來源。

作為管理員,您將確定哪些使用者有權發佈資料來源。對於該網站,這些使用者至少必須具有發佈者網站角色。此外,非管理員使用者必須對他們想要發佈到的專案具有 [檢視] [儲存] 權限。(要檢視使用者權限,請參閱建立內容專案、組和權限的結構一章。)

除了確定可以發佈資料來源的人員之外,您還可以設定權限,以確定可以連線到資料來源以及可以對資料來源進行編輯的人員。透過為專案或單個資料來源設定以下權限角色,您可以設定存取權限:

  • 連接器。此權限角色設定的權限允許使用者或群組透過伺服器上(Web 製作)或 Tableau Desktop 中的工作簿連線到資料來源。

  • 編輯器。此權限角色設定的權限允許使用者或群組連線到伺服器上的資料來源,以及針對該資料來源進行發佈、編輯、下載、刪除、設定權限和排程重新整理。

只有在該專案處於解鎖狀態的情況下,才能設定對專案中的單個資料來源的權限。當您閱讀建立內容專案、組和權限的結構一章時,建議在專案層級設定權限並在設定權限後鎖定專案。

若要設定對專案中的資料來源的權限,請按以下步驟進行操作:

  1. 登入到 Tableau Server。

  2. 按一下頁面頂端的網站功能表,然後選取要使用的網站。

  3. 按一下 [內容] 索引標籤,再按一下 [專案] ,然後選取設定權限所要針對的專案。

  4. [動作] 以下,按一下 [權限]

  5. 選取或新增要將資料來源權限指派到的使用者或群組。

    [資料來源] 下,選取您要設定的權限角色。

  6. 按一下「儲存」

透過即時連線共用 CSV、Excel 或 Access 檔案

您的某些使用者可能會分析作為資料夾中獨立檔案的 CSV(以逗號分隔的值)、Microsoft Excel 或 Microsoft Access 檔案中的資料。這些檔通常被視為資料庫 - 例如,一些使用者可能正在使用 Tableau 分析共用網路位置上的 Excel 檔案中的資料,某些人(也許是那些相同的使用者)還經常更新檔案。

(很明顯,存取共用網路位置上的獨立檔並不等同於使用專用的多使用者資料庫,如 SQL Server、MySQL 或 Oracle。CSV、Excel 和 Access 檔不提供關聯式資料庫中固有類型的效能、使用者級安全性或豐富的查詢功能。)

我們在此處提供的過程示範了如何使用 Windows 電腦上的共用資料夾共用在 Active Directory 環境中執行的 Excel 檔案。

在此情況下,您為 Tableau Server 建立並設定的執行身分使用者帳戶會用作安全上下文來存取網路位置上的 Excel 檔案。

設定共用的網路位置

轉到 Microsoft Windows 網站上的與某人共用檔(Link opens in a new window)頁面,並執行 [在工作群組或域中共用檔和資料夾] 中的過程。這些步驟描述了如何使用 Windows 檔共用嚮導建立一個可以在組織內部使用 UNC(通用命名慣例)存取的共用資料夾。UNC 名稱包括伺服器名稱以及後面的資料夾名稱(很像一個 Web 位址),用於存取您的共用資料夾。下面是一個範例,其中 DATATEAM 是電腦的名稱,shared 是該電腦上共用位置的名稱:

\\DATATEAM\shared

shared 所指的位置實際上可能是深入資料夾結構中的許多層,即使沒有直接在 UNC 名稱中反映出來也不例外。

執行 Windows 檔案共用精靈時,您應該輸入想要共用內容的人員的一個或多個使用者帳戶。對於此過程,請輸入執行身分使用者帳戶,然後將 [權限層級] 設定為 [讀取] 。這意味著,以使用者執行身分執行的任何處理序可以讀取共用位置。在我們例子中,當然,該處理序為 Tableau Server 處理序。

檔共用嚮導的最後一頁顯示了 UNC 路徑。請記下此路徑並將其傳送給您的使用者,以便他們知道在哪裡連線到共用的 Excel 檔案。

將 Excel 檔新增到共用位置

設定共用位置後,請將想要共用的一個或多個 Excel 檔複製到該位置。

建立連線到共用的 Excel 檔案的工作簿

此過程描述了如何存取共用網路位置上的 Excel 檔案,然後如何將工作簿中的該資料發佈到 Tableau Server。此過程真的適合您的使用者,因此請確保他們知道如何執行這些步驟。

使用者使用此方法進行發佈後,存取已發佈工作簿的其他使用者將看到直接來自共用的 Excel 檔案的資料。使用者也可以在使用 Tableau 工作簿時重新整理 Excel 檔案中的資料。

  1. 開啟 Tableau Desktop。在開始頁面上的 [連線] 下,按一下 [Excel]

  2. [開啟] 對話方塊內頂端的檔欄位中,使用 \\computer-name\share-location-name 格式輸入 UNC 路徑。

  3. 選取要連線到的 Excel 工作簿,然後按一下 [開啟]

  4. 請像往常一樣建立一個 Tableau 工作簿,但不要從 Excel 中擷取資料。

  5. 若要進行發佈,請按一下 [伺服器] > [發佈] 。遇到提示時,請輸入 Tableau Server 位址以及具有發佈權限的 Tableau 使用者的認證。

  6. [將工作簿發佈到 Tableau Server] 頁面上,清除 [包括外部檔] 核取方塊。按一下「確定」

  7. 如果需要,請設定權限,然後按一下 [發佈]

保持資料最新

許多情況下,在使用者發佈工作簿後,工作簿或檢視中所顯示的資料會發生變更。例如,如果使用者具有顯示每月銷售資訊的工作簿,則該工作簿的資料必須至少每月更新一次。

如果工作簿的資料來源已設定為使用資料即時連線,則每當開啟工作簿時,該工作簿都可以讀取更新的資料。(這是我們在本節之前的過程中向您介紹的內容)。但是如果工作簿的資料來源依賴於擷取連線,則必須使用最新資料來重新整理擷取。

當使用者發佈具有擷取的工作簿時,擷取會存儲在伺服器上。然後在使用者下載該工作簿或在伺服器上檢視工作簿時,工作簿中會包括該資料。

您可以用兩種方式來重新整理擷取。完全重新整理會用新資料替換當前的擷取。累加式重新整理會將任何新資料新增到現有的擷取。(為了支援累加式重新整理,資料必須包括像日期戳或連續 ID 之類的資料,這些資料可以用於指示累加式重新整理的開始位置)。

您的使用者可以直接在 Tableau Desktop 中重新整理擷取,方法是在 [資料] 功能表中選取資料來源,然後選取 [擷取] > [重新整理]

作為管理員,您也可以直接重新整理擷取:

  1. 登入到 Tableau Server。

  2. 在頁面的頂端,按一下 [工作]

  3. [擷取重新整理] 下面,選取您想要重新整理的工作簿或資料來源。

  4. [動作] 功能表上,按一下 [立即執行]

設定使用者可以從中進行選取的重新整理排程

當使用者發佈包括擷取的工作簿時,使用者可以設定重新整理排程。可以在 Tableau Desktop 內的 [發佈工作簿] 對話方塊中使用此設定。

作為管理員,您可以控制使用者發佈時呈現給使用者的重新整理排程(螢幕截圖中反白顯示的區域)。若要變更您的使用者可以選取的重新整理排程,請按照下列步驟操作:

  1. 登入到 Tableau Server。

  2. 在頁面的頂端,按一下 [排程]

    • 選取排程,然後在 [動作] 功能表上按一下適當的動作,以停用、刪除或編輯您不需要的任何現有計劃。

    • 按一下 [新建排程] ,然後在 [新建排程] 對話方塊中設定排程,以建立一個新排程:

確定計劃重新整理的頻率

重新整理擷取可能非常耗用資源,尤其是在嘗試同時執行多個擷取重新整理的情況下。因此,通常情況下,在非工作時間執行擷取重新整理,並將重新整理安排在遠至業務需求所允許的時間進行是一個好主意。適用於大量擷取的常用方法是每天晚上在非工作時間執行累加式重新整理,然後在週末執行完全重新整理。

設定資料連線快取

當您排程您的資料來源原則時,應該知道 Tableau Server 快取伺服器上託管的工作簿資料的方式。瞭解資料連線快取對於依靠即時資料分析或接近即時的資料分析的組織尤其重要。

請考慮具有資料庫即時連線的工作簿。當使用者在 Web 瀏覽器中與此工作簿交互時,Tableau Server 會將查詢所返回的資料存儲在快取中。這樣,如果工作簿中的使用者交互產生一個已經發出的查詢,則 Tableau 可能會嘗試從快取中讀取資料。從快取中獲取資料通常比重新執行查詢更快,這可以幫助使用者停留在他們的資料分析流程中。

預設情況下,Tableau Server 將盡可能長時間快取和重用資料。若要設定所有資料連線的快取行為,請執行以下操作:

  1. 執行以下命令以設定快取:

    tsm data-access caching set -r <value>

    其中 <value> 是以下選項之一:

    • low 空字串 ("")。這是預設值。Tableau Server 會盡可能長時間快取和重複使用資料。

    • <n>。指定應快取資料的最大分鐘數。例如,tsm data-access caching set -r 2 將最大分鐘數設定為 2。

    • always0(零)。這兩個值都會設定為在每次重新載入頁面時都應重新整理快取。

  2. 應用變更。執行以下命令:

    tsm pending-changes apply

在所有情況下,無論如何設定快取,Tableau Desktop 中的使用者都可以按一下工具列上的 [重新整理資料] ,以強制伺服器傳送新查詢並檢索最新資料。此外,透過 Web 瀏覽器存取資料的使用者可以將 :refresh 參數附加至其 URL。

瞭解使用即時連線和擷取之間的折衷方案

本章的目的是指導您制定連線和資料來源管理原則。像這樣的原則會嘗試回答相當簡單的問題:對於給定的場景,您的使用者是應該存取即時資料,還是應該使用擷取?

首先,某些資料來源將不允許執行擷取 - 他們將只允許使用即時連線。很明顯,如果是這樣,就不必作出決定:使用即時連線。

除了這麼容易的選取之外,這個簡單的問題還有複雜的答案。當您試驗不同的方法,並詳細瞭解對資料效能、存取、新鮮度有影響的許多變數以及特定資料庫的來龍去脈時,您將明確給出一個適用於組織中的使用者的答案。

不過,我們明白您目前需要使您的使用者連線到資料。所以在本節中,我們提供了一些指導性原則,當您推出嶄新的 Tableau Server 時,可以使用這些原則做出合理的資料存取決策。

指導性原則:如果效能比資料新鮮度更重要,請使用擷取

擷取非常適合啟用資料分析師流程。在工作簿中嵌入擷取後,所有資料已可供 Tableau Server 使用,它會將擷取存儲在高效能資料庫中。這通常會產生良好的效能。當使用者拖動維度和度量、應用篩選器以及新增視覺化效果時,他們會立即看到結果。因為使用者與資料快照進行交互,並不直接處理即時資料,所以當使用者在 Tableau 中分析和呈現資料時,基礎資料來源不會具有負擔。

有關使用 Tableau Server 進行倉儲的附注:如果組織中的人員正在使用的工作簿真地遇到關於重新查詢新鮮資料的資料庫難題,則您可能禁不住會使用 Tableau Server 來託管擷取,以嘗試從人員所使用的關聯式資料庫中解除查詢。通常,不建議只是為了解除查詢而使用擷取。這並不是旨在進行資料分析而非資料倉儲的 Tableau Server 的經濟型使用方式。如果您發現使用者正在建立大量的擷取,因為他們在使用即時連線時效能受到影響,那麼您應該考慮在資料庫中進行效能優化,而不是在 Tableau Server 上進行倉儲擷取。

指導性原則:如果業務決策需要即時資料,請使用即時連線

許多資料分析方案需要即時資料。例如,在工作時間模擬交易的財務運作通常需要即時資料。同樣,輪詢方案往往需要接近於即時的資料新鮮度以提供快速分析。通常,如果您的使用者正在處理的資料分析需要以分鐘或秒衡量的資料新鮮度,則應使用即時連線來組建工作簿。

雖然可以頻繁地重新整理擷取,但是正如我們前面所說的那樣,這些更新可能需要大量使用處理器並降低伺服器的效能。同時,大量使用即時連線,特別是搭配使用複雜的工作簿,可能會使給傳統資料庫帶來壓力。因此,您需要確保對 Tableau Server 處理序進行適當升級以大量使用即時連線,並且您的資料庫應該能夠勝任 Tableau Server 的查詢負荷工作。(有關調整您的伺服器的資訊,請參閱通知、監視和調整一章)。

請記住,可以在伺服器上快取使用即時連線的查詢結果。因此,如果真的需要即時資料,請確保將快取設定為更經常進行重新整理,如我們前面在設定資料連線快取中所討論那樣。

指導性原則:如果工作簿包含敏感性資料,請使用即時連線

正如我們之前所說的那樣,您必須確定在使用者發佈時是否允許使用者在工作簿和資料來源中嵌入認證。您的組織的安全和隱私權原則應決定是否允許使用者嵌入認證。

如果您的組織實施使用者層級資料庫權限,請將即時連線用於連線到這些資料庫的工作簿。這樣,將會提示與需要進行驗證的工作簿和資料來源進行交互的使用者輸入認證。對於允許執行身分使用者存取的資料來源,例如 SQL Server、Microsoft Analysis Services 和 Oracle,請確保您已經為執行身分使用者帳戶設定了適當的資料庫資源存取權限。

比較擷取和即時連線的效能

人們經常會問擷取與即時連線哪個更快?如果您通讀了本文,您就會明白,答案是 [看情況] 。

最後,回答這個問題的最好方法是組建一個具有資料庫即時連線的工作簿。大多數情況下,在您組建工作簿並檢視結果時,效能差異顯而易見。

為了更加深入地分析,Tableau 提供了可用於在 Tableau Server 和 Tableau Desktop 上衡量工作簿效能的工具(以下詳細資料)。使用這些工具概觀使用活動連線的工作簿的效能。當有了該資料後,將工作簿變更為使用擷取,然後再次測量效能。

當您比較這些結果時,可能會出現明顯的獲勝者。如果幾乎相等,則可以使用資料來指導您以可能的方式來提高效能。例如,進行篩選以僅使用工作簿所需的資料子集可能會為您提供一個明顯更勝一籌的工作簿。

下面是一些 Tableau 說明和 Tableau Server 說明的連結,用於提供關於如何執行和解讀效能記錄的資訊:

轉到通知、監視和調整繼續。

感謝您的意見回饋! 提交意見回饋時發生錯誤。請再試一次。