ฟังก์ชันการรวบรวมใน Tableau

บทความนี้จะอธิบายฟังก์ชันการรวบรวมและการใช้งานใน Tableau และจะสาธิตวิธีสร้างการคำนวณรวมโดยใช้ตัวอย่าง

ทำไมจึงควรใช้ฟังก์ชันการรวบรวม

ฟังก์ชันการรวบรวมจะช่วยสรุปหรือเปลี่ยนแปลงมุมมองแบบละเอียดของข้อมูลให้คุณได้

ตัวอย่างเช่น คุณอาจจะอยากทราบจำนวนคำสั่งซื้อที่ร้านค้าของคุณได้รับในปีนั้นๆ คุณสามารถใช้ฟังก์ชัน COUNTD เพื่อนับจำนวนคำสั่งซื้อที่ไม่ซ้ำกันที่บริษัทของคุณได้รับ จากนั้นแยกย่อยภาพข้อมูลในแต่ละปีได้

การคำนวณอาจมีลักษณะดังนี้:

COUNTD(Order ID)

การแสดงเป็นภาพอาจมีลักษณะดังนี้:

ฟังก์ชันการรวบรวมที่มีอยู่ใน Tableau

การรวมและเลขทศนิยม: ผลลัพธ์ของการรวมบางรายการอาจไม่ตรงตามที่คุณคาดไว้เสมอไป ตัวอย่างเช่น คุณอาจพบว่าฟังก์ชัน SUM ส่งคืนค่าเช่น -1.42e-14 สำหรับคอลัมน์ของจำนวนที่คุณทราบว่าควรรวมเป็น 0 ทุกประการ ซึ่งเกิดขึ้นเนื่องจากมาตรฐานค่าทศนิยมของ Institute of Electrical and Electronics Engineers (IEEE) 754 กำหนดให้จัดเก็บตัวเลขในรูปแบบไบนารี จึงหมายความว่า บางครั้งตัวเลขจะถูกปัดเศษในระดับความแม่นยำที่ละเอียดมาก คุณสามารถกำจัดสิ่งรบกวนที่อาจเกิดขึ้นเหล่านี้ได้โดยใช้ฟังก์ชัน ROUND (ดูฟังก์ชันตัวเลข) หรือโดยการจัดรูปแบบตัวเลขเพื่อแสดงตำแหน่งทศนิยมให้น้อยลง

ATTR

ไวยากรณ์ATTR(expression)
คำนิยามแสดงค่าของนิพจน์หากมีค่าเดียวสำหรับแถวทั้งหมด หรือแสดงเป็นดอกจัน ค่า null จะถูกละเว้น

AVG

ไวยากรณ์AVG(expression)
คำนิยามแสดงค่าเฉลี่ยของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น
หมายเหตุAVG ใช้ได้กับฟิลด์ตัวเลขเท่านั้น

เก็บ

ไวยากรณ์COLLECT(spatial)
คำนิยามการคำนวณรวมที่รวมค่าในฟิลด์อาร์กิวเมนต์ ค่า null จะถูกละเว้น
หมายเหตุCOLLECT ใช้ได้กับฟิลด์เชิงพื้นที่เท่านั้น

CORR

ไวยากรณ์CORR(expression1, expression2)
เอาต์พุตตัวเลขตั้งแต่ -1 ถึง 1
คำนิยามแสดงค่าสัมประสิทธิ์สหสัมพันธ์ของ Pearson ของนิพจน์สองรายการ
ตัวอย่าง
example
หมายเหตุ

สหสัมพันธ์ของ Pearson วัดความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ผลลัพธ์อยู่ในช่วงตั้งแต่ -1 ถึง +1 โดยรวม ซึ่ง 1 บ่งบอกถึงความสัมพันธ์เชิงเส้นทางบวกอย่างแน่นอน 0 บ่งบอกว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปร และ −1 คือความสัมพันธ์ทางลบอย่างแน่นอน

กำลังสองของผลลัพธ์ CORR เทียบเท่ากับค่า R-Squared สำหรับแบบจำลองเส้นแนวโน้มแบบเชิงเส้น ดูข้อกำหนดของแบบจำลองเส้นแนวโน้ม(ลิงก์จะเปิดในหน้าต่างใหม่)

ใช้กับนิพจน์ LOD ที่กำหนดขอบเขตตาราง:

คุณสามารถใช้ CORR เพื่อแสดงความสัมพันธ์เป็นภาพในการกระจายแบบแยกส่วนโดยใช้ระดับของนิพจน์รายละเอียดในขอบเขตตาราง(ลิงก์จะเปิดในหน้าต่างใหม่) ตัวอย่าง:

{CORR(Sales, Profit)}

เมื่อใช้นิพจน์ระดับรายละเอียด จะเป็นการเรียกใช้สหสัมพันธ์ในทุกแถว หากคุณใช้สูตรอย่างเช่น CORR(Sales, Profit) (โดยไม่มีวงเล็บคลุมเพื่อทำให้เป็นนิพจน์ระดับรายละเอียด) มุมมองจะแสดงสหสัมพันธ์ของแต่ละจุดในแผนภาพการกระจายที่มีแต่ละจุดนั้น ซึ่งไม่ได้มีการกำหนด

ข้อจำกัดของฐานข้อมูล

CORR ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การแยกข้อมูล Tableau, Cloudera Hive, EXASolution, Firebird (เวอร์ชัน 3.0 ขึ้นไป), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica

สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ WINDOW_CORR โปรดดู ฟังก์ชันการคำนวณตาราง(ลิงก์จะเปิดในหน้าต่างใหม่)

COUNT

ไวยากรณ์COUNT(expression)
คำนิยามแสดงจำนวนรายการ ค่า null จะไม่ถูกนับ

COUNTD

ไวยากรณ์COUNTD(expression)
คำนิยามแสดงจำนวนรายการที่ต่างกันในกลุ่ม ค่า null จะไม่ถูกนับ

COVAR

ไวยากรณ์COVAR(expression1, expression2)
คำนิยามแสดงค่าความแปรปรวนร่วมเกี่ยวตัวอย่างของสองนิพจน์
หมายเหตุ

ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวตัวอย่างใช้จำนวนจุดข้อมูลที่ไม่ใช่ค่า ืnull n - 1 เพื่อสร้างมาตรฐานการคำนวณค่าความแปรปรวนร่วมเกี่ยว แทนที่จะใช้ n ซึ่งใช้ในค่าความแปรปรวนร่วมเกี่ยวประชากร (มีให้ใช้งานในฟังก์ชัน COVARP) ค่าความแปรปรวนร่วมเกี่ยวตัวอย่างเป็นตัวเลือกที่เหมาะสมเมื่อข้อมูลเป็นตัวอย่างสุ่มที่ใช้เพื่อประมาณการค่าความแปรปรวนร่วมเกี่ยวของประชากรขนาดใหญ่

หาก <expression1> และ <expression2> เหมือนกัน ตัวอย่างเช่น COVAR([profit], [profit]), COVAR จะแสดงค่าที่บ่งบอกความกว้างของการกระจายค่า

ค่าของ COVAR(X, X) เท่ากับค่าของ VAR(X) และค่าของ STDEV(X)^2 ด้วย

ข้อจำกัดของฐานข้อมูล

COVAR ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การแยกข้อมูล Tableau, Cloudera Hive, EXASolution, Firebird (เวอร์ชัน 3.0 ขึ้นไป), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica

สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ WINDOW_COVAR โปรดดู ฟังก์ชันการคำนวณตาราง(ลิงก์จะเปิดในหน้าต่างใหม่)

COVARP

ไวยากรณ์COVARP(expression 1, expression2)
คำนิยามแสดงค่าความแปรปรวนร่วมเกี่ยวประชากรของสองนิพจน์
หมายเหตุ

ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นค่าความแปรปรวนร่วมเกี่ยวตัวอย่างคูณด้วย (n-1)/n ซึ่งเป็นจำนวนรวมของจุดข้อมูลที่ไม่ใช่ค่า Null ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นตัวเลือกที่เหมาะสมเมื่อมีข้อมูลให้ใช้งานสำหรับรายการที่สนใจทั้งหมด ซึ่งตรงข้ามกับกรณีที่มีเฉพาะเซตย่อยของรายการแบบสุ่ม ซึ่งจะเหมาะกับค่าความแปรปรวนร่วมเกี่ยวตัวอย่าง (ที่มีฟังก์ชัน COVAR)

หาก <expression1> และ <expression2> เหมือนกัน ตัวอย่างเช่น COVARP([profit], [profit]), COVARP จะแสดงค่าที่บ่งบอกความกว้างของการกระจายค่า หมายเหตุ: ค่าของ COVARP(X, X) เท่ากับค่าของ VARP(X) และค่าของ STDEVP(X)^2 ด้วย

ข้อจำกัดของฐานข้อมูล

COVARP สามารถใช้ได้กับแหล่งข้อมูลต่อไปนี้: การแยกข้อมูล Tableau, Cloudera Hive, EXASolution, Firebird (เวอร์ชัน 3.0 ขึ้นไป), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica

สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ WINDOW_COVAR โปรดดู ฟังก์ชันการคำนวณตาราง(ลิงก์จะเปิดในหน้าต่างใหม่)

MAX

ไวยากรณ์MAX(expression) หรือ MAX(expr1, expr2)
เอาต์พุตประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ NULL  หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null
คำนิยาม

แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน

MAX ยังสามารถนำไปใช้กับฟิลด์เดียวเป็นการรวบรวมได้

ตัวอย่าง
MAX(4,7) = 7
MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021#
MAX([Name]) = "Zander"
หมายเหตุ

สำหรับสตริง

โดยปกติ MAX จะเป็นค่าที่อยู่หลังสุดตามลำดับตัวอักษร

สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง MAX จะเป็นค่าที่สูงที่สุดในลำดับการจัดเรียงที่กำหนดตามฐานข้อมูลของคอลัมน์นั้น

สำหรับวันที่

สำหรับวันที่ MAX เป็นวันที่ล่าสุด หาก MAX เป็นการรวบรวม ผลลัพธ์จะไม่มีลำดับชั้นวันที่ หาก MAX คือการเปรียบเทียบ ผลลัพธ์จะคงลำดับชั้นวันที่ไว้

เป็นการรวบรวม

MAX(expression) เป็นฟังก์ชันรวมและแสดงผลลัพธ์รวมเพียงรายการเดียว สิ่งนี้จะแสดงเป็น AGG(expression) ในการแสดงเป็นภาพ

เป็นการเปรียบเทียบ

MAX(expr1, expr2) เปรียบเทียบค่าทั้งสองและแสดงค่าระดับแถว

ดูเพิ่มเติมที่ MIN

ค่ามัธยฐาน

ไวยากรณ์MEDIAN(expression)
คำนิยามแสดงค่ามัธยฐานของนิพจน์ในระเบียนทั้งหมด ค่า null จะถูกละเว้น
หมายเหตุMEDIAN ใช้ได้กับฟิลด์ตัวเลขเท่านั้น
ข้อจำกัดของฐานข้อมูล

MEDIAN ไม่ พร้อมใช้งานสำหรับแหล่งข้อมูลต่อไปนี้: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA, Teradata

สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่)

MIN

ไวยากรณ์MIN(expression) หรือ MIN(expr1, expr2)
เอาต์พุตประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ NULL  หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null
คำนิยาม

แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน

MIN ยังสามารถนำไปใช้กับฟิลด์เดียวเป็นการรวบรวมได้

ตัวอย่าง
MIN(4,7) = 4
MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986#
MIN([Name]) = "Abebi"
หมายเหตุ

สำหรับสตริง

โดยปกติแล้ว MIN จะเป็นค่าที่มาก่อนตามลำดับตัวอักษร

สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง MIN จะเป็นค่าที่ต่ำสุดในลำดับการจัดเรียงที่กำหนดตามฐานข้อมูลของคอลัมน์นั้น

สำหรับวันที่

สำหรับวันที่ MIN เป็นวันแรกที่สุด หาก MIN เป็นการรวบรวม ผลลัพธ์จะไม่มีลำดับชั้นวันที่ หาก MIN คือการเปรียบเทียบ ผลลัพธ์จะคงลำดับชั้นวันที่ไว้

เป็นการรวบรวม

MIN(expression) เป็นฟังก์ชันรวมและแสดงผลลัพธ์รวมเพียงรายการเดียว สิ่งนี้จะแสดงเป็น AGG(expression) ในการแสดงเป็นภาพ

เป็นการเปรียบเทียบ

MIN(expr1, expr2) เปรียบเทียบค่าทั้งสองและแสดงค่าระดับแถว

ดูเพิ่มเติมที่ MAX

PERCENTILE

ไวยากรณ์PERCENTILE(expression, number)
คำนิยามแสดงค่าเปอร์เซ็นต์ไทล์จากนิพจน์ที่กำหนดซึ่งสอดคล้องกับ <number> ที่ระบุ <number> ต้องอยู่ระหว่าง 0 ถึง 1 (โดยรวม) และต้องเป็นค่าตัวเลขคงที่
ตัวอย่าง
PERCENTILE([Score], 0.9)
ข้อจำกัดของฐานข้อมูล

ฟังก์ชันนี้ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การเชื่อมต่อ Microsoft Excel และไฟล์ข้อความที่ไม่ใช่แบบเดิม, การแยกข้อมูลและการแยกข้อมูลประเภทแหล่งข้อมูลเท่านั้น (เช่น Google Analytics, OData หรือ Salesforce), แหล่งข้อมูล Sybase IQ 15.1 ขึ้นไป, แหล่งข้อมูล Oracle 10 ขึ้นไป, แหล่งข้อมูล Cloudera Hive และ Hortonworks Hadoop Hive, EXASolution 4.2 ขึ้นไป

สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่)

STDEV

ไวยากรณ์STDEV(expression)
คำนิยามแสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร

STDEVP

ไวยากรณ์STDEVP(expression)
คำนิยามแสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรที่ได้รับการชดเชย

SUM

ไวยากรณ์SUM(expression)
คำนิยามแสดงผลรวมของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น
หมายเหตุSUM ใช้ได้กับฟิลด์ตัวเลขเท่านั้น

VAR

ไวยากรณ์VAR(expression)
คำนิยามแสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร

VARP

ไวยากรณ์VARP(expression)
คำนิยามแสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรทั้งหมด

สร้างการคำนวณรวม

ทำตามขั้นตอนด้านล่างเพื่อเรียนรู้วิธีสร้างการคำนวณรวม

  1. ใน Tableau Desktop ให้เชื่อมต่อกับแหล่งข้อมูลที่บันทึกไว้ ตัวอย่าง - Superstore ที่มาพร้อมกับ Tableau
  2. ไปที่เวิร์กชีต แล้วเลือกการวิเคราะห์ > สร้างฟิลด์ที่คำนวณ
  3. ในตัวแก้ไขการคำนวณที่เปิดขึ้น ให้ทำดังนี้
    • ตั้งชื่อฟิลด์ที่คำนวณว่า Margin (ส่วนต่าง)
    • ป้อนสูตรต่อไปนี้:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      หมายเหตุ: คุณสามารถใช้การอ้างอิงฟังก์ชันในการค้นหาและเพิ่มฟังก์ชันการรวบรวมและฟังก์ชันอื่นๆ (เช่น ฟังก์ชัน IIF เชิงตรรกะในตัวอย่างนี้) ในสูตรการคำนวณ หากต้องการข้อมูลเพิ่มเติม โปรดดูใช้การอ้างอิงฟังก์ชันในตัวแก้ไขการคำนวณ

    • เมื่อเสร็จแล้ว ให้คลิกตกลง

    การคำนวณรวมใหม่จะปรากฏในส่วนการคำนวณในแผงข้อมูล คุณสามารถใช้ฟิลด์นี้ในการแสดงเป็นภาพได้มากกว่าหนึ่งรายการ เช่นเดียวกับฟิลด์อื่นๆ

    หมายเหตุ: การคำนวณการรวมจะเป็นการวัดผลเสมอ

    เมื่อวาง Margin ลงในแถบหรือการ์ดในเวิร์กชีต ชื่อจะเปลี่ยนเป็น AGG(Margin) ซึ่งจะบ่งชี้ว่าเป็นการคำนวณรวมและไม่สามารถรวมต่อไปได้อีก

    กราฟิกที่แสดงสิ่งที่เกิดขึ้นเมื่อคุณวางการคำนวณรวมลงในบนแถบ ฟิลด์นี้แสดงคำนำหน้า AGG

กฎของการคำนวณรวม

การคำนวณรวมจะใช้กฎต่อไปนี้

  • สำหรับการคำนวณรวมใดๆ คุณไม่สามารถรวมค่ารวมและค่าที่ไม่ใช่ค่ารวมเข้าด้วยกันได้ ตัวอย่างเช่น SUM(Price)*[Items] ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก SUM(Price) เป็นค่ารวมและ Items ไม่ใช่ค่ารวม อย่างไรก็ตาม ทั้ง SUM(Price*Items) และ SUM(Price)*SUM(Items) นั้นถูกต้อง
  • ค่าคงที่ในนิพจน์จะเป็นค่ารวมหรือไม่ใช่ค่ารวมก็ได้แล้วแต่ความเหมาะสม ตัวอย่างเช่น: ทั้ง SUM(Price*7) และ SUM(Price)*7 เป็นนิพจน์ที่ถูกต้อง
  • ฟังก์ชันทั้งหมดสามารถประเมินได้จากค่ารวม อย่างไรก็ตาม อาร์กิวเมนต์ของฟังก์ชันที่กำหนดจะต้องเป็นค่ารวมทั้งหมดหรือไม่ใช่ค่ารวมทั้งหมด ตัวอย่างเช่น MAX(SUM(Sales),Profit) ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก Sales เป็นค่ารวมและ Profit ไม่ใช่ค่ารวม อย่างไรก็ตาม, MAX(SUM(Sales),SUM(Profit)) เป็นนิพจน์ที่ถูกต้อง
  • ผลลัพธ์ของการคำนวณรวมจะเป็นการวัดผลเสมอ ซึ่งรวมถึงนิพจน์ เช่น ATTR(Dimension) หรือ MIN(Dimension)
  • เช่นเดียวกับการรวมที่กำหนดไว้ล่วงหน้า การคำนวณรวมจะมีการคำนวณอย่างถูกต้องสำหรับผลรวมทั้งหมด หากต้องการข้อมูลเพิ่มเติม โปรดดู “รวมทั้งหมด”

ดูเพิ่มเติม

ทำความเข้าใจการคำนวณ: การคำนวณรวม(ลิงก์จะเปิดในหน้าต่างใหม่)

การรวมข้อมูลใน Tableau(ลิงก์จะเปิดในหน้าต่างใหม่)

ฟังก์ชันใน Tableau

ฟังก์ชัน Tableau (ตามหมวดหมู่)(ลิงก์จะเปิดในหน้าต่างใหม่)

ฟังก์ชัน Tableau (เรียงตามตัวอักษร)

ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ