Aggregera funktioner i Tableau

Den här artikeln handlar om aggregerade Tableau-funktioner och deras egenskaper. Den innehåller även exempel på hur du skapar aggregerade beräkningar .

Varför ska du använda aggregerade funktioner

Med de aggregerade funktionerna kan du sammanfatta eller ändra detaljnivån hos dina data.

Du kanske t.ex. vill veta exakt hur många ordrar som kommit in för butiken under ett specifikt år. Använd COUNTD-funktionen för att sammanställa det exakta antalet unika order för verksamheten och dela sedan upp visualiseringen efter år.

Beräkningen kan se ut ungefär så här:

COUNTD(Order ID)

Visualiseringen kan se ut ungefär så här:

Aggregera tillgängliga funktioner i Tableau

Beräkning av aggregering och flyttalsvärde: resultaten från vissa aggregeringar är kanske inte alltid de förväntade. Du kan till exempel upptäcka att funktionen SUM returnerar ett värde som -1.42e-14 för en kolumn med tal där du vet att summan bör vara exakt 0. Detta sker därför att flyttalsstandarden IEEE 754 (Institute of Electrical and Electronics Engineers) kräver att talen lagras i binärt format, vilket innebär att talen ibland avrundas ned till en extrem precisionsnivå. Du kan eliminera denna möjliga distraktion genom att använda funktionen ROUND (se Nummerfunktioner) eller genom att formatera numret till färre decimaler.

ATTR

SyntaxATTR(expression)
DefinitionReturnerar värdet för uttrycket om det har ett enda värde för alla rader. Returnerar i annat fall en asterisk. Null-värden ignoreras.

AVG

SyntaxAVG(expression)
DefinitionReturnerar genomsnittet för alla värden i uttrycket. Null-värden ignoreras.
Obs!AVG kan endast användas med numeriska fält.

COLLECT

SyntaxCOLLECT(spatial)
DefinitionEn aggregerad beräkning som kombinerar värdena i argumentfältet. Null-värden ignoreras.
Obs!COLLECT kan endast användas med spatiala fält.

CORR

SyntaxCORR(expression1, expression2)
UtdataNummer från -1 till 1
DefinitionReturnerar Pearson-korrelationskoefficient för två uttryck.
Exempel
example
Obs!

Pearson-korrelationen mäter den linjära relationen mellan två variabler. Resultat sträcker sig från -1 till och med +1, där 1 betyder en exakt positiv linjär relation, 0 betyder att det inte finns någon linjär relation mellan variansen och -1 är en exakt negativ relation.

Kvadratroten av ett CORR-resultat motsvarar R-kvadratvärdet för en modell med linjär trendlinje. Mer information finns i Termer för trendlinjemodeller(Länken öppnas i ett nytt fönster).

Användning med LOD-uttryck på tabellnivå:

Du kan använda CORR för att visualisera korrelation i ett uppdelat punktdiagram med hjälp av ett LOD-uttryck på tabellnivå(Länken öppnas i ett nytt fönster). Exempel:

{CORR(Sales, Profit)}

Med ett LOD-uttryck körs korrelationen på alla rader. Om du använder en formel som CORR(Sales, Profit) (utan de omgivande parenteserna för att göra det till ett LOD-uttryck), visar vyn korrelationen för varje enskild punkt i punktdiagrammet med alla de andra punkterna, som är odefinierad.

Databasbegränsningar

CORR är tillgängligt med följande datakällor: Tableau-dataextrakt, Cloudera Hive, EXASolution, Firebird (version 3.0 och senare), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata och Vertica.

För andra datakällor bör du överväga att antingen extrahera data eller använda WINDOW_CORR. Se Funktioner för tabellberäkning(Länken öppnas i ett nytt fönster).

COUNT

SyntaxCOUNT(expression)
DefinitionReturnerar antalet poster. Null-värden räknas inte.

COUNTD

SyntaxCOUNTD(expression)
DefinitionReturnerar antalet distinkta poster i en grupp. Null-värden räknas inte.

COVAR

SyntaxCOVAR(expression1, expression2)
DefinitionReturnerar urvalskovariansen för två uttryck.
Obs!

Kovarians kvantifierar hur två variabler ändras tillsammans. En positiv kovarians indikerar att variablerna tenderar att röra sig i samma riktning, som när större värden i en variabel tenderar att motsvara större värden i den andra variabeln. Urvalskovariansen använder antalet icke-null-datapunkter n − 1 för att normalisera kovariansberäkningen, snarare än n, som används av populationskovariansen (tillgänglig med COVARP-funktionen). Urvalskovarians är rätt val när data är ett slumpmässigt urval som används för att uppskatta kovariansen för en större population.

Om <expression1> och <expression2> är samma, till exempel COVAR([profit], [profit]), returnerar COVAR ett värde som indikerar hur brett värdena distribueras.

Värdet för COVAR(X, X) motsvarar värdet för VAR(X) och även värdet för STDEV(X)^2.

Databasbegränsningar

COVAR är tillgängligt med följande datakällor: Tableau-dataextrakt, Cloudera Hive, EXASolution, Firebird (version 3.0 och senare), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata och Vertica.

För andra datakällor bör du överväga att antingen extrahera data eller använda WINDOW_COVAR. Se Funktioner för tabellberäkning(Länken öppnas i ett nytt fönster).

COVARP

SyntaxCOVARP(expression 1, expression2)
DefinitionReturnerar populationskovariansen för två uttryck.
Obs!

Kovarians kvantifierar hur två variabler ändras tillsammans. En positiv kovarians indikerar att variablerna tenderar att röra sig i samma riktning, som när större värden i en variabel tenderar att motsvara större värden i den andra variabeln. Populationskovariansen är urvalskovariansen multiplicerad med (n-1)/n, där n är det totala antalet icke-null-datapunkter. Populationskovarians är rätt val när det finns data tillgängliga för alla frågor av intresse, till skillnad från när det endast finns en slumpmässig delmängd, i vilket fall urvalskovarians (med COVAR-funktionen) är rätt val.

Om <expression1> och <expression2> är samma, till exempel COVARP([profit], [profit]), returnerar COVARP ett värde som indikerar hur brett värdena distribueras. Obs! Värdet för COVARP(X, X) motsvarar värdet för VARP(X) och även värdet för STDEVP(X)^2.

Databasbegränsningar

COVARP är tillgängligt med följande datakällor: Tableau-dataextrakt, Cloudera Hive, EXASolution, Firebird (version 3.0 och senare), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata och Vertica

För andra datakällor bör du överväga att antingen extrahera data eller använda WINDOW_COVAR. Se Funktioner för tabellberäkning(Länken öppnas i ett nytt fönster).

MAX

SyntaxMAX(expression) eller MAX(expr1, expr2)
UtdataSamma datatyp som argumentet, eller NULL om någon del av argumentet är null.
Definition

Returnerar det största värdet för de två argumenten, som måste vara av samma datatyp.

MAX kan även tillämpas på ett enskilt fält som en aggregering.

Exempel
MAX(4,7) = 7
MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021#
MAX([Name]) = "Zander"
Obs!

För strängar

MAX är vanligtvis det värde som kommer sist i alfabetisk ordning.

För datakällor i databaser är strängvärdet MAX det högsta i den sorteringssekvens som definierats i databasen för den kolumnen.

För datum

För datum är MAX det senaste datumet. Om MAX är en aggregering kommer resultatet inte att ha någon datumhierarki. Om MAX är en jämförelse kommer resultatet att behålla datumhierarkin.

Som en aggregering

MAX(expression) är en aggregerad funktion och returnerar ett enda aggregerat resultat. Detta visas som AGG(expression) i visualiseringen.

Som en jämförelse

MAX(expr1, expr2) jämför de två värdena och returnerar ett värde på radnivå.

Se även MIN.

MEDIAN

SyntaxMEDIAN(expression)
DefinitionReturnerar medianen för ett uttryck på alla poster. Null-värden ignoreras.
Obs!MEDIAN kan endast användas med numeriska fält.
Databasbegränsningar

MEDIAN är inte tillgängligt för följande datakällor: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA och Teradata.

För andra typer av datakällor kan du extrahera data till en extraktfil för att använda den här funktionen. Läs mer i Extrahera data(Länken öppnas i ett nytt fönster).

MIN

SyntaxMIN(expression) eller MIN(expr1, expr2)
UtdataSamma datatyp som argumentet, eller NULL om någon del av argumentet är null.
Definition

Returnerar det minsta värdet för de två argumenten, som måste vara av samma datatyp.

MIN kan även tillämpas på ett enskilt fält som en aggregering.

Exempel
MIN(4,7) = 4
MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986#
MIN([Name]) = "Abebi"
Obs!

För strängar

MIN är vanligtvis det värde som kommer först i alfabetisk ordning.

För datakällor i databaser är strängvärdet MIN det lägsta i den sorteringssekvens som definierats i databasen för den kolumnen.

För datum

För datum är MIN det tidigaste datumet. Om MIN är en aggregering kommer resultatet inte att ha någon datumhierarki. Om MIN är en jämförelse kommer resultatet att behålla datumhierarkin.

Som en aggregering

MIN(expression) är en aggregerad funktion och returnerar ett enda aggregerat resultat. Detta visas som AGG(expression) i visualiseringen.

Som en jämförelse

MIN(expr1, expr2) jämför de två värdena och returnerar ett värde på radnivå.

Se även MAX.

PERCENTILE

SyntaxPERCENTILE(expression, number)
DefinitionReturnerar percentilvärdet från det givna uttrycket som motsvarar angivet <number>. <number> måste vara från 0 till och med 1 och måste vara en numerisk konstant.
Exempel
PERCENTILE([Score], 0.9)
Databasbegränsningar

Den här funktionen är tillgänglig för följande datakällor: icke föråldrade versioner av Microsoft Excel- och textfil-anslutningar, datakällor av typen Extrakt och Endast extrakt (till exempel Google Analytics, OData eller Salesforce), Sybase IQ-datakällor i version 15.1 och senare, Oracle-datakällor i version 10 och senare, Cloudera Hive- och Hortonworks Hadoop Hive-datakällor, EXASolution-datakällor i version 4.2 och senare.

För andra typer av datakällor kan du extrahera data till en extraktfil för att använda den här funktionen. Läs mer i Extrahera data(Länken öppnas i ett nytt fönster).

STDEV

SyntaxSTDEV(expression)
DefinitionReturnerar den statistiska standardavvikelsen för alla värden i det angivna uttrycket, utifrån ett urval av populationen.

STDEVP

SyntaxSTDEVP(expression)
DefinitionReturnerar den statistiska standardavvikelsen för alla värden i det angivna uttrycket, utifrån en ensidig population.

SUM

SyntaxSUM(expression)
DefinitionReturnerar summan av alla värden i uttrycket. Null-värden ignoreras.
Obs!SUM kan endast användas med numeriska fält.

VAR

SyntaxVAR(expression)
DefinitionReturnerar den statistiska variansen för alla värden i det givna uttrycket baserat på ett urval av populationen.

VARP

SyntaxVARP(expression)
DefinitionReturnerar den statistiska variansen för alla värden i det givna uttrycket på hela populationen.

Skapa en aggregerad funktion

Följ dessa steg för att lära dig skapa aggregerade beräkningar:

  1. I Tableau Desktop ansluter du till den sparade datakällan Urval - Superstore, som ingår i Tableau.
  2. Navigera till ett arbetsblad och välj Analys > Skapa beräknat fält.
  3. Gör följande i den beräkningsredigerare som visas:
    • Ge det beräknade fältet namnet Marginal.
    • Ange följande formel:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      Obs! Du kan använda funktionsreferensen för att hitta och lägga till aggregerade funktioner eller andra funktioner (som logisk IIF-funktion i det här exemplet) i beräkningen. Mer information finns i Använd funktionsreferensen i beräkningsredigeraren.

    • Klicka på OK när du är klar.

    Den nya aggregerade beräkningen visas under Mätvärden i rutan Data. Precis som med de andra fälten kan du använda detta i en eller flera visualiseringar.

    Obs! Aggregerade beräkningar visas alltid som mätvärden.

    Om Marginal placeras på en hylla eller i ett arbetsbladskort ändras namnet till AGG (Marginal), vilket betyder att det är en aggregerad beräkning och inte kan aggregeras ytterligare.

    Bild på vad som händer när du placerar en aggregerad beräkning på en hylla. AGG-prefixet visas i fältet.

Regler för aggregerade beräkningar

Här följer reglerna för aggregerade beräkningar:

  • Det går inte att kombinera aggregerade värden med uppdelade värden i aggregerade beräkningar. SUM(Price)*[Items] är till exempel inte något giltigt uttryck eftersom SUM(Pris) är aggregerat, men inte Artiklar. Men SUM(Price*Items) och SUM(Price)*SUM(Items) är båda giltiga.
  • Konstanta termer i uttryck fungerar som aggregerade och uppdelade värden efter behov. Till exempel är både SUM(Price*7) och SUM(Price)*7 giltiga uttryck.
  • Alla funktioner går att utvärdera baserat på aggregerade värden. Argumenten som tilldelas funktioner måste däremot antingen vara enbart aggregerade eller uppdelade. MAX(SUM(Sales),Profit) är till exempel inte något giltigt uttryck eftersom Försäljning är aggregerat, men inte Artiklar. Men MAX(SUM(Sales),SUM(Profit)) är ett giltigt uttryck.
  • Resultaten från aggregerade beräkningar visas alltid som mätvärden. Detta inkluderar uttryck som ATTR(Dimension) eller MIN(Dimension).
  • Aggregerade beräkningar är precis som fördefinierade aggregeringar korrekt beräknade för slutsummor. Se Slutsummor för mer information.

Se även

Om beräkningar: Aggregera beräkningar(Länken öppnas i ett nytt fönster)

Dataaggregering i Tableau(Länken öppnas i ett nytt fönster)

Funktioner i Tableau

Tableau-funktioner (efter kategori)(Länken öppnas i ett nytt fönster)

Tableau-funktioner (i bokstavsordning)

Tack för din feedback!Din feedback har skickats in. Tack!