Aggregera funktioner i Tableau

Gäller för: Tableau Cloud, Tableau Desktop, Tableau Public, Tableau Server

Den här artikeln handlar om aggregerade Tableau-funktioner och deras egenskaper. Den innehåller även exempel på hur du skapar aggregerade beräkningar .

Varför ska du använda aggregerade funktioner

Med de aggregerade funktionerna kan du sammanfatta eller ändra detaljnivån hos dina data.

Du kanske t.ex. vill veta exakt hur många ordrar som kommit in för butiken under ett specifikt år. Använd COUNTD-funktionen för att sammanställa det exakta antalet unika order för verksamheten och dela sedan upp visualiseringen efter år.

Beräkningen kan se ut ungefär så här:

COUNTD(Order ID)

Visualiseringen kan se ut ungefär så här:

Aggregera tillgängliga funktioner i Tableau

Beräkning av aggregering och flyttalsvärde: resultaten från vissa aggregeringar är kanske inte alltid de förväntade. Du kan till exempel upptäcka att funktionen SUM returnerar ett värde som -1.42e-14 för en kolumn med tal där du vet att summan bör vara exakt 0. Detta sker därför att flyttalsstandarden IEEE 754 (Institute of Electrical and Electronics Engineers) kräver att talen lagras i binärt format, vilket innebär att talen ibland avrundas ned till en extrem precisionsnivå. Du kan eliminera denna möjliga distraktion genom att använda funktionen ROUND (se Nummerfunktioner) eller genom att formatera numret till färre decimaler.

ATTR

Syntax	`ATTR(expression)`
Definition	Returnerar värdet för uttrycket om det har ett enda värde för alla rader. Returnerar i annat fall en asterisk. Null-värden ignoreras.

AVG

Syntax	`AVG(expression)`
Definition	Returnerar genomsnittet för alla värden i uttrycket. Null-värden ignoreras.
Obs!	`AVG` kan endast användas med numeriska fält.

COLLECT

Syntax	`COLLECT(spatial)`
Definition	En aggregerad beräkning som kombinerar värdena i argumentfältet. Null-värden ignoreras.
Obs!	`COLLECT` kan endast användas med spatiala fält.

CORR

Syntax	`CORR(expression1, expression2)`
Utdata	Nummer från -1 till 1
Definition	Returnerar Pearson-korrelationskoefficient för två uttryck.
Exempel	example
Obs!	Pearson-korrelationen mäter den linjära relationen mellan två variabler. Resultat sträcker sig från -1 till och med +1, där 1 betyder en exakt positiv linjär relation, 0 betyder att det inte finns någon linjär relation mellan variansen och -1 är en exakt negativ relation. Kvadratroten av ett CORR-resultat motsvarar R-kvadratvärdet för en modell med linjär trendlinje. Mer information finns i Termer för trendlinjemodeller(Länken öppnas i ett nytt fönster). Användning med LOD-uttryck på tabellnivå: Du kan använda CORR för att visualisera korrelation i ett uppdelat punktdiagram med hjälp av ett LOD-uttryck på tabellnivå(Länken öppnas i ett nytt fönster). Exempel: {CORR(Sales, Profit)} Med ett LOD-uttryck körs korrelationen på alla rader. Om du använder en formel som `CORR(Sales, Profit)` (utan de omgivande parenteserna för att göra det till ett LOD-uttryck), visar vyn korrelationen för varje enskild punkt i punktdiagrammet med alla de andra punkterna, som är odefinierad.
Databasbegränsningar	`CORR` är tillgängligt med följande datakällor: Tableau-dataextrakt, Cloudera Hive, EXASolution, Firebird (version 3.0 och senare), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata och Vertica. För andra datakällor bör du överväga att antingen extrahera data eller använda `WINDOW_CORR`. Se Funktioner för tabellberäkning(Länken öppnas i ett nytt fönster).

COUNT

Syntax	`COUNT(expression)`
Definition	Returnerar antalet poster. Null-värden räknas inte.

COUNTD

Syntax	`COUNTD(expression)`
Definition	Returnerar antalet distinkta poster i en grupp. Null-värden räknas inte.

COVAR

Syntax	`COVAR(expression1, expression2)`
Definition	Returnerar urvalskovariansen för två uttryck.
Obs!	Kovarians kvantifierar hur två variabler ändras tillsammans. En positiv kovarians indikerar att variablerna tenderar att röra sig i samma riktning, som när större värden i en variabel tenderar att motsvara större värden i den andra variabeln. Urvalskovariansen använder antalet icke-null-datapunkter n − 1 för att normalisera kovariansberäkningen, snarare än n, som används av populationskovariansen (tillgänglig med `COVARP`-funktionen). Urvalskovarians är rätt val när data är ett slumpmässigt urval som används för att uppskatta kovariansen för en större population. Om `<expression1>` och `<expression2>` är samma, till exempel `COVAR([profit], [profit])`, returnerar `COVAR` ett värde som indikerar hur brett värdena distribueras. Värdet för `COVAR(X, X)` motsvarar värdet för `VAR(X)` och även värdet för `STDEV(X)^2`.
Databasbegränsningar	`COVAR` är tillgängligt med följande datakällor: Tableau-dataextrakt, Cloudera Hive, EXASolution, Firebird (version 3.0 och senare), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata och Vertica. För andra datakällor bör du överväga att antingen extrahera data eller använda `WINDOW_COVAR`. Se Funktioner för tabellberäkning(Länken öppnas i ett nytt fönster).

COVARP

Syntax	`COVARP(expression 1, expression2)`
Definition	Returnerar populationskovariansen för två uttryck.
Obs!	Kovarians kvantifierar hur två variabler ändras tillsammans. En positiv kovarians indikerar att variablerna tenderar att röra sig i samma riktning, som när större värden i en variabel tenderar att motsvara större värden i den andra variabeln. Populationskovariansen är urvalskovariansen multiplicerad med (n-1)/n, där n är det totala antalet icke-null-datapunkter. Populationskovarians är rätt val när det finns data tillgängliga för alla frågor av intresse, till skillnad från när det endast finns en slumpmässig delmängd, i vilket fall urvalskovarians (med `COVAR`-funktionen) är rätt val. Om `<expression1>` och `<expression2>` är samma, till exempel `COVARP([profit], [profit])`, returnerar `COVARP` ett värde som indikerar hur brett värdena distribueras. Obs! Värdet för `COVARP(X, X)` motsvarar värdet för `VARP(X)` och även värdet för `STDEVP(X)^2`.
Databasbegränsningar	`COVARP` är tillgängligt med följande datakällor: Tableau-dataextrakt, Cloudera Hive, EXASolution, Firebird (version 3.0 och senare), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata och Vertica För andra datakällor bör du överväga att antingen extrahera data eller använda `WINDOW_COVAR`. Se Funktioner för tabellberäkning(Länken öppnas i ett nytt fönster).

MAX

Syntax	`MAX(expression)` eller `MAX(expr1, expr2)`
Utdata	Samma datatyp som argumentet, eller `NULL` om någon del av argumentet är null.
Definition	Returnerar det största värdet för de två argumenten, som måste vara av samma datatyp. `MAX` kan även tillämpas på ett enskilt fält som en aggregering.
Exempel	MAX(4,7) = 7 MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021# MAX([Name]) = "Zander"
Obs!	För strängar `MAX` är vanligtvis det värde som kommer sist i alfabetisk ordning. För datakällor i databaser är strängvärdet `MAX` det högsta i den sorteringssekvens som definierats i databasen för den kolumnen. För datum För datum är `MAX` det senaste datumet. Om `MAX` är en aggregering kommer resultatet inte att ha någon datumhierarki. Om `MAX` är en jämförelse kommer resultatet att behålla datumhierarkin. Som en aggregering `MAX(expression)` är en aggregerad funktion och returnerar ett enda aggregerat resultat. Detta visas som `AGG(expression)` i visualiseringen. Som en jämförelse `MAX(expr1, expr2)` jämför de två värdena och returnerar ett värde på radnivå. Se även `MIN`.

MEDIAN

Syntax	`MEDIAN(expression)`
Definition	Returnerar medianen för ett uttryck på alla poster. Null-värden ignoreras.
Obs!	`MEDIAN` kan endast användas med numeriska fält.
Databasbegränsningar	`MEDIAN` är inte tillgängligt för följande datakällor: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA och Teradata. För andra typer av datakällor kan du extrahera data till en extraktfil för att använda den här funktionen. Läs mer i Extrahera data(Länken öppnas i ett nytt fönster).

MIN

Syntax	`MIN(expression)` eller `MIN(expr1, expr2)`
Utdata	Samma datatyp som argumentet, eller `NULL` om någon del av argumentet är null.
Definition	Returnerar det minsta värdet för de två argumenten, som måste vara av samma datatyp. `MIN` kan även tillämpas på ett enskilt fält som en aggregering.
Exempel	MIN(4,7) = 4 MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986# MIN([Name]) = "Abebi"
Obs!	För strängar `MIN` är vanligtvis det värde som kommer först i alfabetisk ordning. För datakällor i databaser är strängvärdet `MIN` det lägsta i den sorteringssekvens som definierats i databasen för den kolumnen. För datum För datum är `MIN` det tidigaste datumet. Om `MIN` är en aggregering kommer resultatet inte att ha någon datumhierarki. Om `MIN` är en jämförelse kommer resultatet att behålla datumhierarkin. Som en aggregering `MIN(expression)` är en aggregerad funktion och returnerar ett enda aggregerat resultat. Detta visas som `AGG(expression)` i visualiseringen. Som en jämförelse `MIN(expr1, expr2)` jämför de två värdena och returnerar ett värde på radnivå. Se även `MAX`.

PERCENTILE

Syntax	`PERCENTILE(expression, number)`
Definition	Returnerar percentilvärdet från det givna uttrycket som motsvarar angivet `<number>`. `<number>` måste vara från 0 till och med 1 och måste vara en numerisk konstant.
Exempel	PERCENTILE([Score], 0.9)
Databasbegränsningar	Den här funktionen är tillgänglig för följande datakällor: icke föråldrade versioner av Microsoft Excel- och textfil-anslutningar, datakällor av typen Extrakt och Endast extrakt (till exempel Google Analytics, OData eller Salesforce), Sybase IQ-datakällor i version 15.1 och senare, Oracle-datakällor i version 10 och senare, Cloudera Hive- och Hortonworks Hadoop Hive-datakällor, EXASolution-datakällor i version 4.2 och senare. För andra typer av datakällor kan du extrahera data till en extraktfil för att använda den här funktionen. Läs mer i Extrahera data(Länken öppnas i ett nytt fönster).

STDEV

Syntax	`STDEV(expression)`
Definition	Returnerar den statistiska standardavvikelsen för alla värden i det angivna uttrycket, utifrån ett urval av populationen.

STDEVP

Syntax	`STDEVP(expression)`
Definition	Returnerar den statistiska standardavvikelsen för alla värden i det angivna uttrycket, utifrån en ensidig population.

SUM

Syntax	`SUM(expression)`
Definition	Returnerar summan av alla värden i uttrycket. Null-värden ignoreras.
Obs!	`SUM` kan endast användas med numeriska fält.

VAR

Syntax	`VAR(expression)`
Definition	Returnerar den statistiska variansen för alla värden i det givna uttrycket baserat på ett urval av populationen.

VARP

Syntax	`VARP(expression)`
Definition	Returnerar den statistiska variansen för alla värden i det givna uttrycket på hela populationen.

Skapa en aggregerad funktion

Följ dessa steg för att lära dig skapa aggregerade beräkningar:

I Tableau Desktop ansluter du till den sparade datakällan Urval - Superstore, som ingår i Tableau.
Navigera till ett arbetsblad och välj Analys > Skapa beräknat fält.
Gör följande i den beräkningsredigerare som visas:
- Ge det beräknade fältet namnet Marginal.
- Ange följande formel:
  IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
  Obs! Du kan använda funktionsreferensen för att hitta och lägga till aggregerade funktioner eller andra funktioner (som logisk IIF-funktion i det här exemplet) i beräkningen. Mer information finns i Använd funktionsreferensen i beräkningsredigeraren.
- Klicka på OK när du är klar.
Den nya aggregerade beräkningen visas under Mätvärden i rutan Data. Precis som med de andra fälten kan du använda detta i en eller flera visualiseringar.
Obs! Aggregerade beräkningar visas alltid som mätvärden.
Om Marginal placeras på en hylla eller i ett arbetsbladskort ändras namnet till AGG (Marginal), vilket betyder att det är en aggregerad beräkning och inte kan aggregeras ytterligare.

Regler för aggregerade beräkningar

Här följer reglerna för aggregerade beräkningar:

Det går inte att kombinera aggregerade värden med uppdelade värden i aggregerade beräkningar. SUM(Price)*[Items] är till exempel inte något giltigt uttryck eftersom SUM(Pris) är aggregerat, men inte Artiklar. Men SUM(Price*Items) och SUM(Price)*SUM(Items) är båda giltiga.
Konstanta termer i uttryck fungerar som aggregerade och uppdelade värden efter behov. Till exempel är både SUM(Price*7) och SUM(Price)*7 giltiga uttryck.
Alla funktioner går att utvärdera baserat på aggregerade värden. Argumenten som tilldelas funktioner måste däremot antingen vara enbart aggregerade eller uppdelade. MAX(SUM(Sales),Profit) är till exempel inte något giltigt uttryck eftersom Försäljning är aggregerat, men inte Artiklar. Men MAX(SUM(Sales),SUM(Profit)) är ett giltigt uttryck.
Resultaten från aggregerade beräkningar visas alltid som mätvärden. Detta inkluderar uttryck som ATTR(Dimension) eller MIN(Dimension).
Aggregerade beräkningar är precis som fördefinierade aggregeringar korrekt beräknade för slutsummor. Se Slutsummor för mer information.