規劃資料來源

您的資料在 Tableau 中心。您在探索資料、回答問題以及建構視覺化效果以供自己或他人使用的成功度取決於基礎資料。

如果您的目標是執行一些快速探索或特殊分析,則可跳進、連接到某些資料、拖放一點以建構一些視覺效果,接著使用所需的資訊跳出。但是,如果您的目標是建立將多次使用的分析或資料來源,則最好仔細考慮並規劃資料來源。

Tableau 資料來源

Tableau 資料來源是您的資料來源與 Tableau 之間的連結。它本質上是您的資料(當作即時連線或擷取)、連線資料、內含資料的表格或工作表,以及在 Tableau上使用的資料頂端進行的自訂的總和。這些自訂包括如何合併資料以及中繼資料(如計算、重新命名欄位和預設格式)等內容。

Tableau 資料來源可能包含連到不同資料庫或檔案的多個資料連線。連線資訊包括資料所在的位置(例如檔案名稱和路徑或網路位置),以及如何連線至資料的詳細資訊(例如資料庫伺服器名稱和伺服器登入資訊)。

附註:過去都混用資料來源資料連線這兩個術語,因此在較舊的資料中可能缺乏清楚的界定。

此外,還要牢記 Tableau 資料來源(Tableau 對您的資料的存取以及可能相關的所有自訂)與來源資料本身(如資料庫或 Excel 試算表)之間的區別。從設計資料庫的角度規劃資料來源不在本主題的範圍內。

Tableau 資料來源可以維持嵌入到原來建立的工作簿中,也可以單獨發佈。已發佈的資料來源允許集中和擴展精心策劃的資料來源。詳情請參閱發佈的資料來源的最佳做法

Tableau 資料來源的注意事項

在考慮任何其他事項之前,請確保您清楚資料來源的用途。如果要針對各種使用者的廣泛問題建立面面俱到的資料來源,則與針對效能建構最佳化小眾資料來源的做法不同。一開始就請務必瞭解自己的目標。

以此目標為前提,您必須考慮並規劃下列幾個項目,然後才在 Tableau 中建構資料來源:

  • 位置與存取權限
  • 圖形和整潔度
  • 資料模型和合併資料
  • 中繼資料和自訂
  • 可擴充性、安全性和可探索性
  • 效能和新鮮度

位置與存取權限

資料的位置可以像電腦上的單個 Excel 檔或您建立的 Google 試算表一樣簡單,也可以像使用各種技術的多個資料庫那麼複雜。存取權限還可能涉及資料庫的特定驅動程式或連接器或資料庫伺服器的登入資訊。

要考慮的問題:

  • 正確的 Tableau 使用者是否有權存取資料和 Tableau?
  • 應該使用哪些使用者帳戶登入資料庫?
  • 是否需要使用者篩選或列層級安全性
  • 來源資料位於本機還是在雲端中?
  • 是否有支援的連接器
  • 該資料庫是否有任何限制(它是否支援您希望使用的所有功能)?

圖形和整潔度

您的組織可能已經擁有可以連結且結構良好的資料或是可以利用的 ETL 流程,或者您可能需要使用 Tableau Prep Builder 執行清除和調整作業將資料轉換實用的格式。

要考慮的問題:

  • 資料是否結構良好而能與 Tableau 一起使用?
  • 是否應使用 Tableau Prep Builder 和 Tableau Prep Conductor 來清理和自動執行資料準備流程?
  • 在 Tableau 中最好進行哪些本機計算或操作?
  • 是否不需要這些資料?是否缺少任何資料?

資料模型和合併資料

Tableau 必須知道如何查詢由 Tableau 資料模型傳達的資料。如果資料來自多個表,則需要合併資料。合併資料的方法包括關係、聯結、聯集和混合。

要考慮的問題:

  • 資料是否分佈在多個系統中?
  • 組合每個資料表的最佳方式為何?

中繼資料和自訂

資料的儲存方式通常會導致使用起來不太順手。例如,預設欄位名稱可能難以操作、可能需要自訂格式設定、可能缺少縮寫或代碼的定義,或是基礎資料中可能不存在常見計算。使用這些資訊建立中繼資料層即可更容易理解和使用資料。

要考慮的問題:

  • 應該新增哪些計算?
  • 表和欄位名稱可以理解嗎?
  • 欄位的預設設定是否有用,或是應該自訂這些設定?
  • 是否應進行任何調整才能支援「資料問答」(Ask Data) Tableau Catalog
    請注意,「資料詮釋」此時不支援多表資料來源。

可擴充性、安全性和可探索性

資料來源可能保留在建立資料來源的工作簿中(嵌入式資料來源),或者也可以將資料來源發佈到 Tableau Server 或 Tableau Cloud,而獨立於任何分析作為內容資產自行發佈。這種對已發佈的資料來源的集中化具有安全性和擴展的額外優勢,允許多個使用者存取一致的資料來源。已發佈的資料來源還可以利用 Tableau Catalog 和建議,並為組織提供單一真實來源。

要考慮的問題:

  • 資料來源是否應內嵌在工作簿中?

(以下問題假設已發佈資料來源)

  • 將在哪裡發佈資料來源?
  • 誰將擁有資料來源?
  • 資料來源應擁有哪些驗證權限
  • 資料來源是否會獲得認證

效能和新鮮度

此外,Tableau 資料來源可以是與來源資料的即時連線,也可以將資料複製為可重新整理的擷取。擷取可以提高分析效能或是防止資源耗盡而不利於資料庫系統。

要考慮的問題:

建構高品質的資料來源

若要解釋何為設計良好且效能卓越的資料來源,有許多可探討的細節。不過,您也不一定第一次嘗試就發佈成果。與建立優質的視覺效果一樣,您可以將建構資料來源視為一個持續的過程。嘗試合併您認為需要的資料,然後查看是否可以建構想要的視覺效果。您可以隨時回頭編寫新的計算,或帶入另一個資料表。執行幾項使用者測試,詢問同事看看他們是否能推斷出欄位名稱。

當然,最好僅發佈您自認優質的資料來源,而且僅認可通過品質保證的資料來源。您必須先確認資料來源值得信任,然後才呈現給使用者。

合併資料

如果您的資料來自一個表,則可連線到您的資料以建立資料來源,將表拖曳至畫布上,然後開始建構檢視。但是,如果資料分佈在多個表中或跨多個資料庫,則需要合併資料。合併資料是在「資料來源」頁面上進行。

單一資料庫多個資料庫
  1. 連線到資料。這樣會建立一個資料來源。
  2. 將資料表或工作表拖曳至畫布上並放開該表。
  3. 將第二個表或工作表拖曳至畫布上並放開該表。如此隨即會形成關聯線,表示已自動建立關係;或是隨即開啟「編輯關係」對話方塊,提示您告訴 Tableau 這些表與兩個表相關聯的欄位。
  4. 繼續新增表。
  1. 連線到資料。這樣會建立一個資料來源。
  2. 將資料表或工作表拖曳至畫布上並放開該表。
  3. 帶出第一個資料表後,按兩下左側窗格中「連線」標題右側的「新增」連結。
  4. 在左側窗格的資料連線之間切換,然後將所需的表拖放到畫布上。如此隨即會形成關聯線,表示已自動建立關係;或是隨即開啟「編輯關係」對話方塊,提示您告訴 Tableau 這些表與兩個表相關聯的欄位。
  5. 繼續新增表,在相關的資料連線之間進行切換。

附註:為了將不同資料庫的表建立關聯,必須將表新增為相同資料來源中的資料連線,而不是新的資料來源。資料連線是從左側窗格中的「新增」連結進行新增。您可以從「資料」功能表或「資料來源名稱」旁的圖示下拉式功能表建立新資料來源,如下圖所示。

資料合併方法

關係是在 Tableau 中合併資料的預設方式。關係是合併多個表中的資料以進行分析的動態彈性方式。如有必要,還可以聯結或聯集表。此外也可以混合資料來源。讓我們看看如何在 Tableau 中合併資料的選項,以及每種方法都有用的一些情況。

 

關係根據相關欄位建立兩個表之間的可能聯結。請勿將資料合併在一起以建立新的固定表。在分析期間,使用上下文相關的聯結自動查詢相關表,以產生用於該分析的自訂資料表。

保持適當的詳細層級、不會遺失資料、保留適當的彙總,並處理 null。

聯結根據聯結子句和聯結類型合併兩個資料表,以形成新的固定資料表。通常用於在相同的基本列結構上新增資料欄。

如果所有表中不存在欄位,則可能會造成某些聯結類型的資料遺失。如果表處於不同的詳細層級,則可能會造成資料重複。

聯集合併兩個或多個資料表以形成新的固定資料表。用於在相同基本欄結構上附加資料(新增資料列)。
混合跨兩個或多個單獨的 Tableau 資料來源運作。資料保持獨立。Tableau 會獨立查詢資料來源,並根據為該工作表建立的連結欄位在檢視中一起以視覺化方式呈現結果。模擬左聯結的行為,而且可能篩選來自次要資料來源的資料。

附註:您也可以將資料與自訂 SQL 合併。大多數時候,最好直接在畫布中或透過資料混合來合併資料。如此一來,Tableau 就有最大的靈活性可達到最佳化。但是在某些情況下,可能有些原因導致需要使用自訂 SQL。切記這樣做可能會對效能產生影響,因為 Tableau 被迫按原樣執行自訂 SQL 陳述式。

關係

建立關聯是一種基於這些表之間的共用欄位(欄)處理來自多個表的資料的方法。建立關係就是告訴 Tableau 如何在表之間連接列。Tableau 會保存該資訊,但不會立即將列合併在一起。相反地,在建立視覺效果時,系統會透過關係追溯到分析中的相關欄位,並從其原始表中傳回適當的資料。

由於資料永遠不會完全合併到視覺效果環境之外的單一表中,因此當資料處於不同詳細層級或粒度時,關係非常有用。例如,如果您需要在一個表中處理每日降雨量資料,但在另一個表中使用每小時溫度的資料。

Tableau 支援相同資料庫中的表和不同資料庫中的表之間的關係。

有關如何使用關聯合併表的詳情,請參閱與您的資料建立關聯和以下 Tableau 部落格文章:

聯結

「聯結」是合併依常用欄位建立關聯之表格的方法。使用聯結合併資料後會產生一個透過新增資料欄以進行橫向擴展的表。

有關如何在 Tableau 中聯接資料的詳細資料,請參閱聯結資料

資料混合

當使用資料混合來合併資料時,您可以將所謂的主資料來源中的資料與一個或多個輔助資料來源的通用欄位進行合併。

當您需要變更按照工作表逐一設定資料來源的方式時,以及當您希望合併不允許關係或聯結的資料庫時

(例如 Cube 資料來源或已發佈資料來源),資料混合非常有用。

使用資料混合來合併資料後會產生一個透過新增資料欄以進行橫向擴展的虛擬表。系統會將每個資料來源的資料彙總為通用層級,然後再一起顯示於視覺效果中。

有關混合資料的工作方式以及如何在 Tableau 中混合資料的詳細資料,請參閱混合您的資料

聯集

合併是一種將值(列)附加到表的方法。如果表具有相同的欄,則可以聯集這些表。使用並聯集資料後會組建一個虛擬表,此表具有相同的欄,但會透過新增資料列進行縱向擴展。

您可以透過以下兩種方式之一合併表:手動或使用萬用字元搜尋。有關如何在 Tableau 中使用這些方法之一合併資料的詳細資料,請參閱聯集資料

感謝您的意見反應!已成功提交您的意見回饋。謝謝!