混合您的資料

資料混合是一種合併多重來源資料的方法。資料混合可從次要資料來源加入其他資訊,並直接在檢視中,將該資訊與主資料來源中的資料一同顯示。

如果各工作表上的混合關係(連結欄位)必須不同,或者在合併已發佈的資料來源時,資料混合特別實用。

合併資料的選項

合併資料的方法有許多種,每種方式都有其優勢和弱項。

「關係」是預設的方法,可用於多數案例中,包括在詳細資料層級各異的表之間建立關係。「關係」是靈活的方法,且可針對不同工作表的分析結構做出調整。但是,無法在來自已發佈資料來源的資料表之間建立關係。

「聯結」結合表格的方式是新增其他相同列結構中的資料欄。如果表格位於不同的詳細資料層級,這種方法可能導致資料遺失或重複,因此必須修正聯結的資料來源才能開始分析。不能在聯結中使用已發佈的資料來源。

「混合」與「關係」或「聯結」不同,從未直接合併資料。反之,「混合」會單獨查詢每個資料來源,將結果彙總到適當的層級,然後一並以圖表方式在檢視中顯示。因此,混合可以處理不同的詳細資料層級,且能與已發佈的資料來源搭配使用。混合不會建立新的混合資料來源(因此不能作為「混合資料來源」發佈)。相反,它們只是每個工作表可視化的混合結果。

混合資料的步驟

資料混合是按照工作逐一執行,並在次要資料來源的欄位用於檢視中時建立。

要在工作簿中建立混合,需要連線至少兩個資料來源。然後將一個資料來源中的某個欄位加入該工作表 - 它成為主要資料來源。然後切換到另一個資料來源,並使用相同工作表中的某欄位,該資料來源即可成為次要資料來源。資料窗格中會顯示一個橙色連結圖示,代表要用來混合資料來源的欄位。

  1. 確定工作簿具有多個資料來源。移至 [資料] > [新資料來源],即可新增次要資料來源。

    提示:混合需要兩個以上不重複的資料來源,而且會分別列在「資料」窗格中。將第一個資料來源新增到其他連線,即可在「資料來源」頁面上啟用「關係」和「聯結」。

  2. 將一個欄位拖到檢視中。此資料來源將是主要資料來源。
  3. 切換至其他資料來源,並確認其與主資料來源之間是混合關係。
    • 如果出現橙色連結欄位圖示 (),表示已自動連結該資料來源。只要有至少一個作用中連結,資料就可以混合。
    • 如果出現灰色的斷開連結圖示 (),請按一下應連結兩個資料來源的欄位旁邊的圖示。斜線將消失,代表一個作用中連結。
    • 如果所需欄位旁並未出現連結圖示,請參閱定義混合的混合關係
  4. 將欄位從次要資料來源拖曳至檢視中。

只要在相同檢視中使用此次要資料來源,即可建立混合。在以下範例中,我們的主資料來源是「Movie Adaptations」,次要資料來源則為「Bookshop」。

  • 資料來源上具有藍色核取記號,代表此為主資料來源。在檢視中使用的主資料來源欄位沒有任何標示。
  • 資料來源上有橙色核取記號表示此為次要資料來源,且 [資料] 窗格下方會有一個橙色長條。在檢視中使用的次要資料來源欄位會有一個橙色核取記號。

瞭解主資料來源和次要資料來源

資料混合需要主資料來源和至少一個輔助資料來源。檢視中使用的第一個資料來源將成為主資料來源,而且會定義該檢視。如此一來,便可限制來自次要資料來源的值,檢視中只會顯示在主資料來源中具有對應相符項的值。此可與左側聯結進行比較。

例如,如果主資料來源的 [月份] 欄位僅包含 4 月、5 月和 6 月,則即使次要資料來源具有十二個月份的值,根據月份建立的任何檢視仍只會顯示 4 月、5 月和 6 月的值。如果需要涵蓋所有十二個月的分析,不妨重新建立工作表並先使用其他資料來源,藉此切換所用的主資料來源。

瞭解詳情:資料來源順序的影響

以下範例使用相同欄位上連結的相同資料來源,而這兩次也都採用相同的方式建立視覺效果樣。由於指定為主來源的資料來源不同,結果也有所差異。

  1. 在此例中,降雨資料來源中的 [月份] 欄位會先帶入檢視中。由於降雨僅包含三個月份,所以將花粉資料集合新增為次要來源時,只有三個月份的值會帶入檢視中。
  2. 顯示三個月的視覺效果產品螢幕截圖
  3. 在另一份工作表中,花粉資料集合中的 [月份] 欄位先帶入檢視中。因此,全部十二個月份的資料都會顯示。將降雨資料新增為次要來源時,在該資料集合中將只顯示三個月份的降雨資料。
  4. 顯示十二個月的視覺效果產品螢幕截圖

處理混合資料來源

由於資料混合本質的緣故,跨混合資料來源進行處理時,請務必牢記幾個重點。

使用多個資料來源的欄位執行計算可能與一般計算略微不同。必須在單一資料來源中建立計算;計算編輯器的頂部指示計算所在的資料來源。

  • 彙總。其他資料來源使用的任何欄位預設都會以 SUM 的彙總形式帶入,不過此預設值可加以變更。由於計算無法混合彙總與非彙總引數,因此將要進行計算之資料來源的欄位也必須加以彙總。(在下圖中,SUM 彙總屬於自動新增,而 sum 彙總則為手動新增)。
  • 點標記法。屬於另一個資料來源的計算所參照的任何欄位,都將使用點標記法參照其資料來源。(在下圖中,針對範例 - 超級市場中建立的計算,[銷售目標] 欄位變為 [Sales.Targets].[Sales Target]。而在銷售目標中建立的計算,[銷售] 欄位則成為 [[範例 - 超級市場]].[Sales])。
  • 這些是每個資料來源中內建相同計算的同等版本。在兩種情況下,這是 SUM(Sales) 或 SUM(Sales Target)。

除了在處理計算上略有不同,對於次要資料來源也有一些限制。您可能無法依據次要資料來源的欄位進行排序,且動作篩選條件可能無法按預期方式使用混合資料。有關詳情,請參閱其他資料混合問題

定義混合的混合關係

若要讓 Tableau 知道如何結合多個來源的資料,資料來源之間必須具有一個或多個常用維度。此公用維度稱為連結欄位。次要資料來源 [資料] 窗格中的有效連結欄位會以有效連結圖示 () 標示,而潛在連結欄位則以斷開連結圖示 () 標示。未在主資料來源中指示連結欄位。

例如,如果混合交易資料和配額資料混合,其中的地理欄位可能是所需的連結欄位,以便您可以就同一區域的配額分析配額與績效。

附註:為使混合能正確運作,連結欄位也必須共用值或成員。Tableau 可根據共用值建立混合資料的檢視。例如,如果色彩是兩個資料來源的連結欄位,Tableau 將比對主來源的 [紫色] 和次要來源的 [紫色] 之資料。但是 [淺藍色] 不會正確對應到 [淺藍色],因此這兩者之一必須重新指定別名。就像重新命名欄位可協助 Tableau 識別連結欄位,您也可編輯這些欄位中成員的別名。有關詳情,請參閱在檢視中建立別名以重新命名成員

建立連結

如果主資料來源和次要資料來源中的連結欄位具有相同名稱,Tableau 將自動建立關係。若已建立主資料來源(即在檢視中使用欄位),且已在「資料」窗格中選取次要資料來源時,則這兩個資料來源中有相同名稱的所有欄位,都會在次要資料來源中顯示連結圖示()。如果在檢視中使用主資料來源中的相關欄位,則該連結會自動變為活動狀態。

如果次要資料來源沒有任何連結圖示,您可能需要透過以下兩種方式之一來協助 Tableau 建立連結: 

  1. 如果通用維度沒有相同的名稱(例如「Title」和「 Book Title」),請重新命名其中之一,以便 Tableau 將其識別為常用維度並建立連結。

  2. 或者,您也可以手動定義主資料來源和次要資料來源中欄位之間的關係。有關手動建立連結關係的詳情,請參閱以下內容

您可視需要建立任意數量的有效連結或潛在連結欄位。按一下資料窗格中的斷開連結圖示 (),使關係呈現有效狀態。

手動定義連結關係

如果常用維度沒有相同的名稱,則您必須手動對應維度之間的關係。

  1. 選取「資料」>「編輯混合關係...」

  2. 在「混合關係」對話方塊中,確認您已從「主資料來源」下拉清單中選取了主資料來源。

  3. [次要資料來源] 窗格中選取次要資料來源。任何現有的自動混合關係都是可見的(並且可以通過將鼠標懸停在行上並單擊 x 來刪除)。在關係清單中選取 [自訂],然後按一下 [新增]

  4. 在 [新增/編輯欄位對應] 對話方塊中,執行以下操作:

    1. 從主資料來源中選取欄位。

    2. 從次要資料來源中選取可以比較的欄位。

    3. 按一下 [OK] (確定)。

      在此範例中, 「區段」「客戶區段」對應。

      新增/編輯關係對話方塊的產品 UI

      提示:針對日期,您可精確指定關係。展開日期欄位,並選取想要的日期單位,例如:精確日期、月、年等。

  5. 視需要建立任意數量的欄位對應,然後按一下「確定」

多個連結

如同關係或聯結一樣,有時資料來源之間的連結是由多個欄位所定義。例如,如果區域銷售配額是以每月為單位,則交易銷售資料和配額資料必須針對區域和月份都建立混合,才能將資料正確彙整到檢視中。多個連結可同時處於有效狀態。

瞭解詳情:多個連結欄位的影響

根據多個欄位混合資料時,只有在這些欄位的資料合併與兩個資料集合皆比對相符時,檢視才會包含這些值。我們舉個例子做說明。

假設我們有兩個資料表,一份用於記錄賞鳥人確實看到的鳥,另一份用於記錄回報指出所看到的鳥。

如果我們設定一個混合檢視,其中包含主資料來源([看到的鳥])的 [賞鳥人][鳥的數量] 欄位,並納入次要資料來源 [回報的鳥] 中的 [回報數量] 欄位,則 Tableau 會自動針對 [賞鳥人] 進行混合。

我們可以得知,賞鳥人 A 看到了三隻鳥且回報兩次,B 看到了四隻且回報一次,而 C 則看到 8 隻鳥且回報兩次。

不過,還有另一個潛在連結欄位,[看到的鳥類]。為何不能也對此欄位進行混合? 有什麼不同嗎? 

有很大的不同。現在我們看到賞鳥人 A 和 C 各自僅回報一次,而 B 則沒有這筆記錄。為什麼會這樣? 

原因是這些賞鳥人都未據實以報。這些人只根據日誌項目(上圖中的藍色長條)回報看到的鳥時,他們回報的鳥類與實際看到的並不相符(請注意 [看到的鳥] 次要資料來源中第二欄的 Null)。若他們隨附相片(橙色長條)佐證回報記錄時,則回報屬實(即兩欄的 [看到的鳥類] 皆相符)。

由於三份報告的種類並不相符,因此將「看到的種類」作為連結欄位使用時,會捨棄那些列。在檢視中,只會顯示與兩個連結欄位的值皆相符的資料。

外賣食物

連結多個欄位時,請謹慎從事。雖然按一下圖示就能輕鬆建立有效連結,但是過度連結或連結了不需要的欄位,都可能會嚴重影響分析結果。

聯接與資料混合之間的差異

資料混合模擬傳統的左聯接。二者之間的主要區別在於執行彙總的時機。聯結會先合併資料,再進行彙總。混合會先進行彙總,再合併資料。

左聯接

使用左聯接組合資料時,會向資料庫中傳送查詢,查詢在哪裡執行聯接。左側聯結會傳回左側資料表中的所有列,以及右側資料表的任何對應列。接著會將聯結結果回傳至 Tableau,並在進行彙總後於視覺效果中顯示。

左側聯結會帶入左側資料表的所有列。公用欄為 [使用者 ID][客戶 ID],有來自右側資料表的對應資訊時,便會傳回資料。否則便顯示 Null。

 

假設您有相同的資料表,但是順序相反。這個新的左側聯結就會產生不同的結果。同樣地,左側聯結會從新的左側資料表中取得所有資料,但基本上會忽略右側資料表中的某一列。使用者 ID = 4 的資料列將不會納入,因為左側資料表中並沒有客戶 ID = 4 這一列。

資料混合

使用資料混合合併資料時,會為工作表上使用的每個資料來源將查詢傳送到資料庫。查詢結果將以彙總資料的形式回傳至 Tableau,並一起顯示在視覺效果中。

附註:彙總屬性量值很簡單,我們可輕鬆取得數值的總和、平均、最大值或其他彙總值。度量值根據檢視中欄位的彙總方式進行彙總。但是,次要資料來源的所有欄位都必須加以彙總。這要如何用於維度? 維度值使用 ATTR 彙總函數進行彙總,此動作會傳回次要資料來源中所有列的單一值。如果這些列中有多個值,則顯示星號 (*)。這可解讀為「檢視中此標記有來自次要資料來源的多個值」。

檢視將根據連結欄位,使用主資料來源(左側資料表)中的所有值,以及次要資料來源(右側資料表)中的對應列。

假設您具有以下資料表。如果連結欄位是 [使用者 ID][客戶 ID],則並非所有值都會顯示在產生的資料表中,原因如下:

  • 從結果中的 Null 值可看出,左側資料表中的列在右側資料表中沒有相符的對應列。

  • 從結果中的星號 (*) 可看出,右側資料表的列中具有多個對應的值。

若有相關的量值,系統也會加以彙總,如下所示:

重要:在具有混合資料的檢視中,星號 (*) 表示有多個值。只要確保主資料來源中的每個標記,與次要資料來源都只有一個相符的值,即可解決此情況,方法也許是將主資料來源和次要來源互換。有關詳情,請參閱資料混合疑難排解

資料混合總覽

  • 資料混合是按照工作表逐一進行的。
  • 欄位的使用順序決定了何者為主資料來源及次要資料來源。
  • 主資料來源以藍色的核取記號表示,而任何次要資料來源及其中的欄位都會有橙色核取記號。
  • 連結欄位可根據共用欄位名稱自動決定,也可以手動建立混合關係。
  • 資料混合行為與左側聯結類似,可能會導致缺少次要資料來源的資料。
  • 可能會出現星號 (*)。這表示單一標記中有多個維度值,因為資料混合採用彙總結果,並將其合併在檢視中。
  • 次要資料來源可用來為主資料來源中的欄位值重新提供別名。有關詳情,請參閱使用資料混合為欄位值指定別名

資料混合限制

  • 存在一些與非累加彙總(例如 COUNTD、MEDIAN 和 RAWSQLAGG)相關的資料混合限制。有關詳情,請參閱資料混合疑難排解
  • 混合的資料來源無法做為一個單位發佈。而是應該將每個資料來源單獨發佈至相同伺服器,然後再混合發行的資料來源。
  • 次要資料來源的資料一律要在計算中彙總。
  • 若要混合 cube 資料來源,該資料來源必須為主資料來源。
感謝您的意見反應!已成功提交您的意見回饋。謝謝!