混合您的資料
資料混合是一種合併多重來源資料的方法。資料混合可從次要資料來源加入其他資訊,並直接在檢視中,將該資訊與主資料來源中的資料一同顯示。
如果各工作表上的混合關係(連結欄位)必須不同,或者在合併已發佈的資料來源時,資料混合特別實用。
合併資料的選項
合併資料的方法有許多種,每種方式都有其優勢和弱項。
「關係」是預設的方法,可用於多數案例中,包括在詳細資料層級各異的表之間建立關係。「關係」是靈活的方法,且可針對不同工作表的分析結構做出調整。但是,無法在來自已發佈資料來源的資料表之間建立關係。
「聯結」結合表格的方式是新增其他相同列結構中的資料欄。如果表格位於不同的詳細資料層級,這種方法可能導致資料遺失或重複,因此必須修正聯結的資料來源才能開始分析。不能在聯結中使用已發佈的資料來源。
「混合」與「關係」或「聯結」不同,從未直接合併資料。反之,「混合」會單獨查詢每個資料來源,將結果彙總到適當的層級,然後一並以圖表方式在檢視中顯示。因此,混合可以處理不同的詳細資料層級,且能與已發佈的資料來源搭配使用。混合不會建立新的混合資料來源(因此不能作為「混合資料來源」發佈)。相反,它們只是每個工作表可視化的混合結果。
資料混合是按照工作逐一執行,並在次要資料來源的欄位用於檢視中時建立。
要在工作簿中建立混合,需要連線至少兩個資料來源。然後將一個資料來源中的某個欄位加入該工作表 - 它成為主要資料來源。然後切換到另一個資料來源,並使用相同工作表中的某欄位,該資料來源即可成為次要資料來源。資料窗格中會顯示一個橙色連結圖示,代表要用來混合資料來源的欄位。
- 確定工作簿具有多個資料來源。移至 [資料] > [新資料來源],即可新增次要資料來源。
提示:混合需要兩個以上不重複的資料來源,而且會分別列在「資料」窗格中。將第一個資料來源新增到其他連線,即可在「資料來源」頁面上啟用「關係」和「聯結」。
- 將一個欄位拖到檢視中。此資料來源將是主要資料來源。
- 切換至其他資料來源,並確認其與主資料來源之間是混合關係。
- 如果出現橙色連結欄位圖示 (
),表示已自動連結該資料來源。只要有至少一個作用中連結,資料就可以混合。
- 如果出現灰色的斷開連結圖示 (
),請按一下應連結兩個資料來源的欄位旁邊的圖示。斜線將消失,代表一個作用中連結。
- 如果所需欄位旁並未出現連結圖示,請參閱定義混合的混合關係。
- 如果出現橙色連結欄位圖示 (
- 將欄位從次要資料來源拖曳至檢視中。
只要在相同檢視中使用此次要資料來源,即可建立混合。在以下範例中,我們的主資料來源是「Movie Adaptations」,次要資料來源則為「Bookshop」。
- 資料來源上具有藍色核取記號,代表此為主資料來源。在檢視中使用的主資料來源欄位沒有任何標示。
- 資料來源上有橙色核取記號表示此為次要資料來源,且 [資料] 窗格下方會有一個橙色長條。在檢視中使用的次要資料來源欄位會有一個橙色核取記號。
資料混合需要主資料來源和至少一個輔助資料來源。檢視中使用的第一個資料來源將成為主資料來源,而且會定義該檢視。如此一來,便可限制來自次要資料來源的值,檢視中只會顯示在主資料來源中具有對應相符項的值。此可與左側聯結進行比較。
例如,如果主資料來源的 [月份] 欄位僅包含 4 月、5 月和 6 月,則即使次要資料來源具有十二個月份的值,根據月份建立的任何檢視仍只會顯示 4 月、5 月和 6 月的值。如果需要涵蓋所有十二個月的分析,不妨重新建立工作表並先使用其他資料來源,藉此切換所用的主資料來源。
處理混合資料來源
由於資料混合本質的緣故,跨混合資料來源進行處理時,請務必牢記幾個重點。
使用多個資料來源的欄位執行計算可能與一般計算略微不同。必須在單一資料來源中建立計算;計算編輯器的頂部指示計算所在的資料來源。
- 彙總。其他資料來源使用的任何欄位預設都會以 SUM 的彙總形式帶入,不過此預設值可加以變更。由於計算無法混合彙總與非彙總引數,因此將要進行計算之資料來源的欄位也必須加以彙總。(在下圖中,SUM 彙總屬於自動新增,而 sum 彙總則為手動新增)。
- 點標記法。屬於另一個資料來源的計算所參照的任何欄位,都將使用點標記法參照其資料來源。(在下圖中,針對範例 - 超級市場中建立的計算,[銷售目標] 欄位變為 [Sales.Targets].[Sales Target]。而在銷售目標中建立的計算,[銷售] 欄位則成為 [[範例 - 超級市場]].[Sales])。
- 這些是每個資料來源中內建相同計算的同等版本。在兩種情況下,這是 SUM(Sales) 或 SUM(Sales Target)。
除了在處理計算上略有不同,對於次要資料來源也有一些限制。您可能無法依據次要資料來源的欄位進行排序,且動作篩選條件可能無法按預期方式使用混合資料。有關詳情,請參閱其他資料混合問題。
若要讓 Tableau 知道如何結合多個來源的資料,資料來源之間必須具有一個或多個常用維度。此公用維度稱為連結欄位。次要資料來源 [資料] 窗格中的有效連結欄位會以有效連結圖示 () 標示,而潛在連結欄位則以斷開連結圖示 (
) 標示。未在主資料來源中指示連結欄位。
例如,如果混合交易資料和配額資料混合,其中的地理欄位可能是所需的連結欄位,以便您可以就同一區域的配額分析配額與績效。
附註:為使混合能正確運作,連結欄位也必須共用值或成員。Tableau 可根據共用值建立混合資料的檢視。例如,如果色彩是兩個資料來源的連結欄位,Tableau 將比對主來源的 [紫色] 和次要來源的 [紫色] 之資料。但是 [淺藍色] 不會正確對應到 [淺藍色],因此這兩者之一必須重新指定別名。就像重新命名欄位可協助 Tableau 識別連結欄位,您也可編輯這些欄位中成員的別名。有關詳情,請參閱在檢視中建立別名以重新命名成員。
建立連結
如果主資料來源和次要資料來源中的連結欄位具有相同名稱,Tableau 將自動建立關係。若已建立主資料來源(即在檢視中使用欄位),且已在「資料」窗格中選取次要資料來源時,則這兩個資料來源中有相同名稱的所有欄位,都會在次要資料來源中顯示連結圖示( 或
)。如果在檢視中使用主資料來源中的相關欄位,則該連結會自動變為活動狀態。
如果次要資料來源沒有任何連結圖示,您可能需要透過以下兩種方式之一來協助 Tableau 建立連結:
如果通用維度沒有相同的名稱(例如「Title」和「 Book Title」),請重新命名其中之一,以便 Tableau 將其識別為常用維度並建立連結。
或者,您也可以手動定義主資料來源和次要資料來源中欄位之間的關係。有關手動建立連結關係的詳情,請參閱以下內容
您可視需要建立任意數量的有效連結或潛在連結欄位。按一下資料窗格中的斷開連結圖示 (),使關係呈現有效狀態。
多個連結
如同關係或聯結一樣,有時資料來源之間的連結是由多個欄位所定義。例如,如果區域銷售配額是以每月為單位,則交易銷售資料和配額資料必須針對區域和月份都建立混合,才能將資料正確彙整到檢視中。多個連結可同時處於有效狀態。
資料混合模擬傳統的左聯接。二者之間的主要區別在於執行彙總的時機。聯結會先合併資料,再進行彙總。混合會先進行彙總,再合併資料。
左聯接
使用左聯接組合資料時,會向資料庫中傳送查詢,查詢在哪裡執行聯接。左側聯結會傳回左側資料表中的所有列,以及右側資料表的任何對應列。接著會將聯結結果回傳至 Tableau,並在進行彙總後於視覺效果中顯示。
左側聯結會帶入左側資料表的所有列。公用欄為 [使用者 ID] 和 [客戶 ID],有來自右側資料表的對應資訊時,便會傳回資料。否則便顯示 Null。
假設您有相同的資料表,但是順序相反。這個新的左側聯結就會產生不同的結果。同樣地,左側聯結會從新的左側資料表中取得所有資料,但基本上會忽略右側資料表中的某一列。使用者 ID = 4 的資料列將不會納入,因為左側資料表中並沒有客戶 ID = 4 這一列。
資料混合
使用資料混合合併資料時,會為工作表上使用的每個資料來源將查詢傳送到資料庫。查詢結果將以彙總資料的形式回傳至 Tableau,並一起顯示在視覺效果中。
附註:彙總屬性量值很簡單,我們可輕鬆取得數值的總和、平均、最大值或其他彙總值。度量值根據檢視中欄位的彙總方式進行彙總。但是,次要資料來源的所有欄位都必須加以彙總。這要如何用於維度? 維度值使用 ATTR 彙總函數進行彙總,此動作會傳回次要資料來源中所有列的單一值。如果這些列中有多個值,則顯示星號 (*)。這可解讀為「檢視中此標記有來自次要資料來源的多個值」。
檢視將根據連結欄位,使用主資料來源(左側資料表)中的所有值,以及次要資料來源(右側資料表)中的對應列。
假設您具有以下資料表。如果連結欄位是 [使用者 ID] 和 [客戶 ID],則並非所有值都會顯示在產生的資料表中,原因如下:
從結果中的 Null 值可看出,左側資料表中的列在右側資料表中沒有相符的對應列。
從結果中的星號 (*) 可看出,右側資料表的列中具有多個對應的值。
若有相關的量值,系統也會加以彙總,如下所示:
重要:在具有混合資料的檢視中,星號 (*) 表示有多個值。只要確保主資料來源中的每個標記,與次要資料來源都只有一個相符的值,即可解決此情況,方法也許是將主資料來源和次要來源互換。有關詳情,請參閱資料混合疑難排解。
- 資料混合是按照工作表逐一進行的。
- 欄位的使用順序決定了何者為主資料來源及次要資料來源。
- 主資料來源以藍色的核取記號表示,而任何次要資料來源及其中的欄位都會有橙色核取記號。
- 連結欄位可根據共用欄位名稱自動決定,也可以手動建立混合關係。
- 資料混合行為與左側聯結類似,可能會導致缺少次要資料來源的資料。
- 可能會出現星號 (*)。這表示單一標記中有多個維度值,因為資料混合採用彙總結果,並將其合併在檢視中。
- 次要資料來源可用來為主資料來源中的欄位值重新提供別名。有關詳情,請參閱使用資料混合為欄位值指定別名。
資料混合限制
- 存在一些與非累加彙總(例如 COUNTD、MEDIAN 和 RAWSQLAGG)相關的資料混合限制。有關詳情,請參閱資料混合疑難排解。
- 混合的資料來源無法做為一個單位發佈。而是應該將每個資料來源單獨發佈至相同伺服器,然後再混合發行的資料來源。
- 次要資料來源的資料一律要在計算中彙總。
- 若要混合 cube 資料來源,該資料來源必須為主資料來源。