ฟังก์ชันการรวบรวมใน Tableau

นำไปใช้กับ Tableau Cloud, Tableau Desktop, Tableau Public, Tableau Server

บทความนี้จะอธิบายฟังก์ชันการรวบรวมและการใช้งานใน Tableau และจะสาธิตวิธีสร้างการคำนวณรวมโดยใช้ตัวอย่าง

ทำไมจึงควรใช้ฟังก์ชันการรวบรวม

ฟังก์ชันการรวบรวมจะช่วยสรุปหรือเปลี่ยนแปลงมุมมองแบบละเอียดของข้อมูลให้คุณได้

ตัวอย่างเช่น คุณอาจจะอยากทราบจำนวนคำสั่งซื้อที่ร้านค้าของคุณได้รับในปีนั้นๆ คุณสามารถใช้ฟังก์ชัน COUNTD เพื่อนับจำนวนคำสั่งซื้อที่ไม่ซ้ำกันที่บริษัทของคุณได้รับ จากนั้นแยกย่อยภาพข้อมูลในแต่ละปีได้

การคำนวณอาจมีลักษณะดังนี้:

COUNTD(Order ID)

การแสดงเป็นภาพอาจมีลักษณะดังนี้:

ฟังก์ชันการรวบรวมที่มีอยู่ใน Tableau

การรวมและเลขทศนิยม: ผลลัพธ์ของการรวมบางรายการอาจไม่ตรงตามที่คุณคาดไว้เสมอไป ตัวอย่างเช่น คุณอาจพบว่าฟังก์ชัน SUM ส่งคืนค่าเช่น -1.42e-14 สำหรับคอลัมน์ของจำนวนที่คุณทราบว่าควรรวมเป็น 0 ทุกประการ ซึ่งเกิดขึ้นเนื่องจากมาตรฐานค่าทศนิยมของ Institute of Electrical and Electronics Engineers (IEEE) 754 กำหนดให้จัดเก็บตัวเลขในรูปแบบไบนารี จึงหมายความว่า บางครั้งตัวเลขจะถูกปัดเศษในระดับความแม่นยำที่ละเอียดมาก คุณสามารถกำจัดสิ่งรบกวนที่อาจเกิดขึ้นเหล่านี้ได้โดยใช้ฟังก์ชัน ROUND (ดูฟังก์ชันตัวเลข) หรือโดยการจัดรูปแบบตัวเลขเพื่อแสดงตำแหน่งทศนิยมให้น้อยลง

ATTR

ไวยากรณ์	`ATTR(expression)`
คำนิยาม	แสดงค่าของนิพจน์หากมีค่าเดียวสำหรับแถวทั้งหมด หรือแสดงเป็นดอกจัน ค่า null จะถูกละเว้น

AVG

ไวยากรณ์	`AVG(expression)`
คำนิยาม	แสดงค่าเฉลี่ยของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น
หมายเหตุ	`AVG` ใช้ได้กับฟิลด์ตัวเลขเท่านั้น

เก็บ

ไวยากรณ์	`COLLECT(spatial)`
คำนิยาม	การคำนวณรวมที่รวมค่าในฟิลด์อาร์กิวเมนต์ ค่า null จะถูกละเว้น
หมายเหตุ	`COLLECT` ใช้ได้กับฟิลด์เชิงพื้นที่เท่านั้น

CORR

ไวยากรณ์	`CORR(expression1, expression2)`
เอาต์พุต	ตัวเลขตั้งแต่ -1 ถึง 1
คำนิยาม	แสดงค่าสัมประสิทธิ์สหสัมพันธ์ของ Pearson ของนิพจน์สองรายการ
ตัวอย่าง	example
หมายเหตุ	สหสัมพันธ์ของ Pearson วัดความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ผลลัพธ์อยู่ในช่วงตั้งแต่ -1 ถึง +1 โดยรวม ซึ่ง 1 บ่งบอกถึงความสัมพันธ์เชิงเส้นทางบวกอย่างแน่นอน 0 บ่งบอกว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปร และ −1 คือความสัมพันธ์ทางลบอย่างแน่นอน กำลังสองของผลลัพธ์ CORR เทียบเท่ากับค่า R-Squared สำหรับแบบจำลองเส้นแนวโน้มแบบเชิงเส้น ดูข้อกำหนดของแบบจำลองเส้นแนวโน้ม(ลิงก์จะเปิดในหน้าต่างใหม่) ใช้กับนิพจน์ LOD ที่กำหนดขอบเขตตาราง: คุณสามารถใช้ CORR เพื่อแสดงความสัมพันธ์เป็นภาพในการกระจายแบบแยกส่วนโดยใช้ระดับของนิพจน์รายละเอียดในขอบเขตตาราง(ลิงก์จะเปิดในหน้าต่างใหม่) ตัวอย่าง: {CORR(Sales, Profit)} เมื่อใช้นิพจน์ระดับรายละเอียด จะเป็นการเรียกใช้สหสัมพันธ์ในทุกแถว หากคุณใช้สูตรอย่างเช่น `CORR(Sales, Profit)` (โดยไม่มีวงเล็บคลุมเพื่อทำให้เป็นนิพจน์ระดับรายละเอียด) มุมมองจะแสดงสหสัมพันธ์ของแต่ละจุดในแผนภาพการกระจายที่มีแต่ละจุดนั้น ซึ่งไม่ได้มีการกำหนด
ข้อจำกัดของฐานข้อมูล	`CORR` ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การแยกข้อมูล Tableau, Cloudera Hive, EXASolution, Firebird (เวอร์ชัน 3.0 ขึ้นไป), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ `WINDOW_CORR` โปรดดู ฟังก์ชันการคำนวณตาราง(ลิงก์จะเปิดในหน้าต่างใหม่)

COUNT

ไวยากรณ์	`COUNT(expression)`
คำนิยาม	แสดงจำนวนรายการ ค่า null จะไม่ถูกนับ

COUNTD

ไวยากรณ์	`COUNTD(expression)`
คำนิยาม	แสดงจำนวนรายการที่ต่างกันในกลุ่ม ค่า null จะไม่ถูกนับ

COVAR

ไวยากรณ์	`COVAR(expression1, expression2)`
คำนิยาม	แสดงค่าความแปรปรวนร่วมเกี่ยวตัวอย่างของสองนิพจน์
หมายเหตุ	ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวตัวอย่างใช้จำนวนจุดข้อมูลที่ไม่ใช่ค่า ืnull n - 1 เพื่อสร้างมาตรฐานการคำนวณค่าความแปรปรวนร่วมเกี่ยว แทนที่จะใช้ n ซึ่งใช้ในค่าความแปรปรวนร่วมเกี่ยวประชากร (มีให้ใช้งานในฟังก์ชัน `COVARP`) ค่าความแปรปรวนร่วมเกี่ยวตัวอย่างเป็นตัวเลือกที่เหมาะสมเมื่อข้อมูลเป็นตัวอย่างสุ่มที่ใช้เพื่อประมาณการค่าความแปรปรวนร่วมเกี่ยวของประชากรขนาดใหญ่ หาก `<expression1>` และ `<expression2>` เหมือนกัน ตัวอย่างเช่น `COVAR([profit], [profit])`, `COVAR` จะแสดงค่าที่บ่งบอกความกว้างของการกระจายค่า ค่าของ `COVAR(X, X)` เท่ากับค่าของ `VAR(X)` และค่าของ `STDEV(X)^2` ด้วย
ข้อจำกัดของฐานข้อมูล	`COVAR` ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การแยกข้อมูล Tableau, Cloudera Hive, EXASolution, Firebird (เวอร์ชัน 3.0 ขึ้นไป), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ `WINDOW_COVAR` โปรดดู ฟังก์ชันการคำนวณตาราง(ลิงก์จะเปิดในหน้าต่างใหม่)

COVARP

ไวยากรณ์	`COVARP(expression 1, expression2)`
คำนิยาม	แสดงค่าความแปรปรวนร่วมเกี่ยวประชากรของสองนิพจน์
หมายเหตุ	ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นค่าความแปรปรวนร่วมเกี่ยวตัวอย่างคูณด้วย (n-1)/n ซึ่งเป็นจำนวนรวมของจุดข้อมูลที่ไม่ใช่ค่า Null ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นตัวเลือกที่เหมาะสมเมื่อมีข้อมูลให้ใช้งานสำหรับรายการที่สนใจทั้งหมด ซึ่งตรงข้ามกับกรณีที่มีเฉพาะเซตย่อยของรายการแบบสุ่ม ซึ่งจะเหมาะกับค่าความแปรปรวนร่วมเกี่ยวตัวอย่าง (ที่มีฟังก์ชัน `COVAR`) หาก `<expression1>` และ `<expression2>` เหมือนกัน ตัวอย่างเช่น `COVARP([profit], [profit])`, `COVARP` จะแสดงค่าที่บ่งบอกความกว้างของการกระจายค่า หมายเหตุ: ค่าของ `COVARP(X, X)` เท่ากับค่าของ `VARP(X)` และค่าของ `STDEVP(X)^2` ด้วย
ข้อจำกัดของฐานข้อมูล	`COVARP` สามารถใช้ได้กับแหล่งข้อมูลต่อไปนี้: การแยกข้อมูล Tableau, Cloudera Hive, EXASolution, Firebird (เวอร์ชัน 3.0 ขึ้นไป), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ `WINDOW_COVAR` โปรดดู ฟังก์ชันการคำนวณตาราง(ลิงก์จะเปิดในหน้าต่างใหม่)

MAX

ไวยากรณ์	`MAX(expression)` หรือ `MAX(expr1, expr2)`
เอาต์พุต	ประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ `NULL` หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null
คำนิยาม	แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน `MAX` ยังสามารถนำไปใช้กับฟิลด์เดียวเป็นการรวบรวมได้
ตัวอย่าง	MAX(4,7) = 7 MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021# MAX([Name]) = "Zander"
หมายเหตุ	สำหรับสตริง โดยปกติ `MAX` จะเป็นค่าที่อยู่หลังสุดตามลำดับตัวอักษร สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง `MAX` จะเป็นค่าที่สูงที่สุดในลำดับการจัดเรียงที่กำหนดตามฐานข้อมูลของคอลัมน์นั้น สำหรับวันที่ สำหรับวันที่ `MAX` เป็นวันที่ล่าสุด หาก `MAX` เป็นการรวบรวม ผลลัพธ์จะไม่มีลำดับชั้นวันที่ หาก `MAX` คือการเปรียบเทียบ ผลลัพธ์จะคงลำดับชั้นวันที่ไว้ เป็นการรวบรวม `MAX(expression)` เป็นฟังก์ชันรวมและแสดงผลลัพธ์รวมเพียงรายการเดียว สิ่งนี้จะแสดงเป็น `AGG(expression)` ในการแสดงเป็นภาพ เป็นการเปรียบเทียบ `MAX(expr1, expr2)` เปรียบเทียบค่าทั้งสองและแสดงค่าระดับแถว ดูเพิ่มเติมที่ `MIN`

ค่ามัธยฐาน

ไวยากรณ์	`MEDIAN(expression)`
คำนิยาม	แสดงค่ามัธยฐานของนิพจน์ในระเบียนทั้งหมด ค่า null จะถูกละเว้น
หมายเหตุ	`MEDIAN` ใช้ได้กับฟิลด์ตัวเลขเท่านั้น
ข้อจำกัดของฐานข้อมูล	`MEDIAN` ไม่ พร้อมใช้งานสำหรับแหล่งข้อมูลต่อไปนี้: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA, Teradata สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่)

MIN

ไวยากรณ์	`MIN(expression)` หรือ `MIN(expr1, expr2)`
เอาต์พุต	ประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ `NULL` หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null
คำนิยาม	แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน `MIN` ยังสามารถนำไปใช้กับฟิลด์เดียวเป็นการรวบรวมได้
ตัวอย่าง	MIN(4,7) = 4 MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986# MIN([Name]) = "Abebi"
หมายเหตุ	สำหรับสตริง โดยปกติแล้ว `MIN` จะเป็นค่าที่มาก่อนตามลำดับตัวอักษร สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง `MIN` จะเป็นค่าที่ต่ำสุดในลำดับการจัดเรียงที่กำหนดตามฐานข้อมูลของคอลัมน์นั้น สำหรับวันที่ สำหรับวันที่ `MIN` เป็นวันแรกที่สุด หาก `MIN` เป็นการรวบรวม ผลลัพธ์จะไม่มีลำดับชั้นวันที่ หาก `MIN` คือการเปรียบเทียบ ผลลัพธ์จะคงลำดับชั้นวันที่ไว้ เป็นการรวบรวม `MIN(expression)` เป็นฟังก์ชันรวมและแสดงผลลัพธ์รวมเพียงรายการเดียว สิ่งนี้จะแสดงเป็น `AGG(expression)` ในการแสดงเป็นภาพ เป็นการเปรียบเทียบ `MIN(expr1, expr2)` เปรียบเทียบค่าทั้งสองและแสดงค่าระดับแถว ดูเพิ่มเติมที่ `MAX`

PERCENTILE

ไวยากรณ์	`PERCENTILE(expression, number)`
คำนิยาม	แสดงค่าเปอร์เซ็นต์ไทล์จากนิพจน์ที่กำหนดซึ่งสอดคล้องกับ `<number>` ที่ระบุ `<number>` ต้องอยู่ระหว่าง 0 ถึง 1 (โดยรวม) และต้องเป็นค่าตัวเลขคงที่
ตัวอย่าง	PERCENTILE([Score], 0.9)
ข้อจำกัดของฐานข้อมูล	ฟังก์ชันนี้ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การเชื่อมต่อ Microsoft Excel และไฟล์ข้อความที่ไม่ใช่แบบเดิม, การแยกข้อมูลและการแยกข้อมูลประเภทแหล่งข้อมูลเท่านั้น (เช่น Google Analytics, OData หรือ Salesforce), แหล่งข้อมูล Sybase IQ 15.1 ขึ้นไป, แหล่งข้อมูล Oracle 10 ขึ้นไป, แหล่งข้อมูล Cloudera Hive และ Hortonworks Hadoop Hive, EXASolution 4.2 ขึ้นไป สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่)

STDEV

ไวยากรณ์	`STDEV(expression)`
คำนิยาม	แสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร

STDEVP

ไวยากรณ์	`STDEVP(expression)`
คำนิยาม	แสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรที่ได้รับการชดเชย

SUM

ไวยากรณ์	`SUM(expression)`
คำนิยาม	แสดงผลรวมของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น
หมายเหตุ	`SUM` ใช้ได้กับฟิลด์ตัวเลขเท่านั้น

VAR

ไวยากรณ์	`VAR(expression)`
คำนิยาม	แสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร

VARP

ไวยากรณ์	`VARP(expression)`
คำนิยาม	แสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรทั้งหมด

สร้างการคำนวณรวม

ทำตามขั้นตอนด้านล่างเพื่อเรียนรู้วิธีสร้างการคำนวณรวม

ใน Tableau Desktop ให้เชื่อมต่อกับแหล่งข้อมูลที่บันทึกไว้ ตัวอย่าง - Superstore ที่มาพร้อมกับ Tableau
ไปที่เวิร์กชีต แล้วเลือกการวิเคราะห์ > สร้างฟิลด์ที่คำนวณ
ในตัวแก้ไขการคำนวณที่เปิดขึ้น ให้ทำดังนี้
- ตั้งชื่อฟิลด์ที่คำนวณว่า Margin (ส่วนต่าง)
- ป้อนสูตรต่อไปนี้:
  IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
  หมายเหตุ: คุณสามารถใช้การอ้างอิงฟังก์ชันในการค้นหาและเพิ่มฟังก์ชันการรวบรวมและฟังก์ชันอื่นๆ (เช่น ฟังก์ชัน IIF เชิงตรรกะในตัวอย่างนี้) ในสูตรการคำนวณ หากต้องการข้อมูลเพิ่มเติม โปรดดูใช้การอ้างอิงฟังก์ชันในตัวแก้ไขการคำนวณ
- เมื่อเสร็จแล้ว ให้คลิกตกลง
การคำนวณรวมใหม่จะปรากฏในส่วนการคำนวณในแผงข้อมูล คุณสามารถใช้ฟิลด์นี้ในการแสดงเป็นภาพได้มากกว่าหนึ่งรายการ เช่นเดียวกับฟิลด์อื่นๆ
หมายเหตุ: การคำนวณการรวมจะเป็นการวัดผลเสมอ
เมื่อวาง Margin ลงในแถบหรือการ์ดในเวิร์กชีต ชื่อจะเปลี่ยนเป็น AGG(Margin) ซึ่งจะบ่งชี้ว่าเป็นการคำนวณรวมและไม่สามารถรวมต่อไปได้อีก

กฎของการคำนวณรวม

การคำนวณรวมจะใช้กฎต่อไปนี้

สำหรับการคำนวณรวมใดๆ คุณไม่สามารถรวมค่ารวมและค่าที่ไม่ใช่ค่ารวมเข้าด้วยกันได้ ตัวอย่างเช่น SUM(Price)*[Items] ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก SUM(Price) เป็นค่ารวมและ Items ไม่ใช่ค่ารวม อย่างไรก็ตาม ทั้ง SUM(Price*Items) และ SUM(Price)*SUM(Items) นั้นถูกต้อง
ค่าคงที่ในนิพจน์จะเป็นค่ารวมหรือไม่ใช่ค่ารวมก็ได้แล้วแต่ความเหมาะสม ตัวอย่างเช่น: ทั้ง SUM(Price*7) และ SUM(Price)*7 เป็นนิพจน์ที่ถูกต้อง
ฟังก์ชันทั้งหมดสามารถประเมินได้จากค่ารวม อย่างไรก็ตาม อาร์กิวเมนต์ของฟังก์ชันที่กำหนดจะต้องเป็นค่ารวมทั้งหมดหรือไม่ใช่ค่ารวมทั้งหมด ตัวอย่างเช่น MAX(SUM(Sales),Profit) ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก Sales เป็นค่ารวมและ Profit ไม่ใช่ค่ารวม อย่างไรก็ตาม, MAX(SUM(Sales),SUM(Profit)) เป็นนิพจน์ที่ถูกต้อง
ผลลัพธ์ของการคำนวณรวมจะเป็นการวัดผลเสมอ ซึ่งรวมถึงนิพจน์ เช่น ATTR(Dimension) หรือ MIN(Dimension)
เช่นเดียวกับการรวมที่กำหนดไว้ล่วงหน้า การคำนวณรวมจะมีการคำนวณอย่างถูกต้องสำหรับผลรวมทั้งหมด หากต้องการข้อมูลเพิ่มเติม โปรดดู “รวมทั้งหมด”