ฟังก์ชันการรวบรวมใน Tableau
บทความนี้จะอธิบายฟังก์ชันการรวบรวมและการใช้งานใน Tableau และจะสาธิตวิธีสร้างการคำนวณรวมโดยใช้ตัวอย่าง
ทำไมจึงควรใช้ฟังก์ชันการรวบรวม
ฟังก์ชันการรวบรวมจะช่วยสรุปหรือเปลี่ยนแปลงมุมมองแบบละเอียดของข้อมูลให้คุณได้
ตัวอย่างเช่น คุณอาจจะอยากทราบจำนวนคำสั่งซื้อที่ร้านค้าของคุณได้รับในปีนั้นๆ คุณสามารถใช้ฟังก์ชัน COUNTD เพื่อนับจำนวนคำสั่งซื้อที่ไม่ซ้ำกันที่บริษัทของคุณได้รับ จากนั้นแยกย่อยภาพข้อมูลในแต่ละปีได้
การคำนวณอาจมีลักษณะดังนี้:
COUNTD(Order ID)
การแสดงเป็นภาพอาจมีลักษณะดังนี้:
ฟังก์ชันการรวบรวมที่มีอยู่ใน Tableau
การรวมและเลขทศนิยม: ผลลัพธ์ของการรวมบางรายการอาจไม่ตรงตามที่คุณคาดไว้เสมอไป ตัวอย่างเช่น คุณอาจพบว่าฟังก์ชัน SUM ส่งคืนค่าเช่น -1.42e-14 สำหรับคอลัมน์ของจำนวนที่คุณทราบว่าควรรวมเป็น 0 ทุกประการ ซึ่งเกิดขึ้นเนื่องจากมาตรฐานค่าทศนิยมของ Institute of Electrical and Electronics Engineers (IEEE) 754 กำหนดให้จัดเก็บตัวเลขในรูปแบบไบนารี จึงหมายความว่า บางครั้งตัวเลขจะถูกปัดเศษในระดับความแม่นยำที่ละเอียดมาก คุณสามารถกำจัดสิ่งรบกวนที่อาจเกิดขึ้นเหล่านี้ได้โดยใช้ฟังก์ชัน ROUND (ดูฟังก์ชันตัวเลข) หรือโดยการจัดรูปแบบตัวเลขเพื่อแสดงตำแหน่งทศนิยมให้น้อยลง
ATTR
ไวยากรณ์ | ATTR(expression) |
คำนิยาม | แสดงค่าของนิพจน์หากมีค่าเดียวสำหรับแถวทั้งหมด หรือแสดงเป็นดอกจัน ค่า null จะถูกละเว้น |
AVG
ไวยากรณ์ | AVG(expression) |
คำนิยาม | แสดงค่าเฉลี่ยของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น |
หมายเหตุ | AVG ใช้ได้กับฟิลด์ตัวเลขเท่านั้น |
เก็บ
ไวยากรณ์ | COLLECT(spatial) |
คำนิยาม | การคำนวณรวมที่รวมค่าในฟิลด์อาร์กิวเมนต์ ค่า null จะถูกละเว้น |
หมายเหตุ | COLLECT ใช้ได้กับฟิลด์เชิงพื้นที่เท่านั้น |
CORR
ไวยากรณ์ | CORR(expression1, expression2) |
เอาต์พุต | ตัวเลขตั้งแต่ -1 ถึง 1 |
คำนิยาม | แสดงค่าสัมประสิทธิ์สหสัมพันธ์ของ Pearson ของนิพจน์สองรายการ |
ตัวอย่าง | example |
หมายเหตุ | สหสัมพันธ์ของ Pearson วัดความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ผลลัพธ์อยู่ในช่วงตั้งแต่ -1 ถึง +1 โดยรวม ซึ่ง 1 บ่งบอกถึงความสัมพันธ์เชิงเส้นทางบวกอย่างแน่นอน 0 บ่งบอกว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปร และ −1 คือความสัมพันธ์ทางลบอย่างแน่นอน กำลังสองของผลลัพธ์ CORR เทียบเท่ากับค่า R-Squared สำหรับแบบจำลองเส้นแนวโน้มแบบเชิงเส้น ดูข้อกำหนดของแบบจำลองเส้นแนวโน้ม(ลิงก์จะเปิดในหน้าต่างใหม่) ใช้กับนิพจน์ LOD ที่กำหนดขอบเขตตาราง: คุณสามารถใช้ CORR เพื่อแสดงความสัมพันธ์เป็นภาพในการกระจายแบบแยกส่วนโดยใช้ระดับของนิพจน์รายละเอียดในขอบเขตตาราง(ลิงก์จะเปิดในหน้าต่างใหม่) ตัวอย่าง: {CORR(Sales, Profit)} เมื่อใช้นิพจน์ระดับรายละเอียด จะเป็นการเรียกใช้สหสัมพันธ์ในทุกแถว หากคุณใช้สูตรอย่างเช่น |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ |
COUNT
ไวยากรณ์ | COUNT(expression) |
คำนิยาม | แสดงจำนวนรายการ ค่า null จะไม่ถูกนับ |
COUNTD
ไวยากรณ์ | COUNTD(expression) |
คำนิยาม | แสดงจำนวนรายการที่ต่างกันในกลุ่ม ค่า null จะไม่ถูกนับ |
COVAR
ไวยากรณ์ | COVAR(expression1, expression2) |
คำนิยาม | แสดงค่าความแปรปรวนร่วมเกี่ยวตัวอย่างของสองนิพจน์ |
หมายเหตุ | ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวตัวอย่างใช้จำนวนจุดข้อมูลที่ไม่ใช่ค่า ืnull n - 1 เพื่อสร้างมาตรฐานการคำนวณค่าความแปรปรวนร่วมเกี่ยว แทนที่จะใช้ n ซึ่งใช้ในค่าความแปรปรวนร่วมเกี่ยวประชากร (มีให้ใช้งานในฟังก์ชัน หาก ค่าของ |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ |
COVARP
ไวยากรณ์ | COVARP(expression 1, expression2) |
คำนิยาม | แสดงค่าความแปรปรวนร่วมเกี่ยวประชากรของสองนิพจน์ |
หมายเหตุ | ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นค่าความแปรปรวนร่วมเกี่ยวตัวอย่างคูณด้วย (n-1)/n ซึ่งเป็นจำนวนรวมของจุดข้อมูลที่ไม่ใช่ค่า Null ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นตัวเลือกที่เหมาะสมเมื่อมีข้อมูลให้ใช้งานสำหรับรายการที่สนใจทั้งหมด ซึ่งตรงข้ามกับกรณีที่มีเฉพาะเซตย่อยของรายการแบบสุ่ม ซึ่งจะเหมาะกับค่าความแปรปรวนร่วมเกี่ยวตัวอย่าง (ที่มีฟังก์ชัน หาก |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ |
MAX
ไวยากรณ์ | MAX(expression) หรือ MAX(expr1, expr2) |
เอาต์พุต | ประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ NULL หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null |
คำนิยาม | แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน
|
ตัวอย่าง | MAX(4,7) = 7 |
หมายเหตุ | สำหรับสตริง โดยปกติ สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง สำหรับวันที่ สำหรับวันที่ เป็นการรวบรวม
เป็นการเปรียบเทียบ
ดูเพิ่มเติมที่ |
ค่ามัธยฐาน
ไวยากรณ์ | MEDIAN(expression) |
คำนิยาม | แสดงค่ามัธยฐานของนิพจน์ในระเบียนทั้งหมด ค่า null จะถูกละเว้น |
หมายเหตุ | MEDIAN ใช้ได้กับฟิลด์ตัวเลขเท่านั้น |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่) |
MIN
ไวยากรณ์ | MIN(expression) หรือ MIN(expr1, expr2) |
เอาต์พุต | ประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ NULL หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null |
คำนิยาม | แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน
|
ตัวอย่าง | MIN(4,7) = 4 |
หมายเหตุ | สำหรับสตริง โดยปกติแล้ว สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง สำหรับวันที่ สำหรับวันที่ เป็นการรวบรวม
เป็นการเปรียบเทียบ
ดูเพิ่มเติมที่ |
PERCENTILE
ไวยากรณ์ | PERCENTILE(expression, number) |
คำนิยาม | แสดงค่าเปอร์เซ็นต์ไทล์จากนิพจน์ที่กำหนดซึ่งสอดคล้องกับ <number> ที่ระบุ <number> ต้องอยู่ระหว่าง 0 ถึง 1 (โดยรวม) และต้องเป็นค่าตัวเลขคงที่ |
ตัวอย่าง | PERCENTILE([Score], 0.9) |
ข้อจำกัดของฐานข้อมูล | ฟังก์ชันนี้ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การเชื่อมต่อ Microsoft Excel และไฟล์ข้อความที่ไม่ใช่แบบเดิม, การแยกข้อมูลและการแยกข้อมูลประเภทแหล่งข้อมูลเท่านั้น (เช่น Google Analytics, OData หรือ Salesforce), แหล่งข้อมูล Sybase IQ 15.1 ขึ้นไป, แหล่งข้อมูล Oracle 10 ขึ้นไป, แหล่งข้อมูล Cloudera Hive และ Hortonworks Hadoop Hive, EXASolution 4.2 ขึ้นไป สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่) |
STDEV
ไวยากรณ์ | STDEV(expression) |
คำนิยาม | แสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร |
STDEVP
ไวยากรณ์ | STDEVP(expression) |
คำนิยาม | แสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรที่ได้รับการชดเชย |
SUM
ไวยากรณ์ | SUM(expression) |
คำนิยาม | แสดงผลรวมของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น |
หมายเหตุ | SUM ใช้ได้กับฟิลด์ตัวเลขเท่านั้น |
VAR
ไวยากรณ์ | VAR(expression) |
คำนิยาม | แสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร |
VARP
ไวยากรณ์ | VARP(expression) |
คำนิยาม | แสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรทั้งหมด |
สร้างการคำนวณรวม
ทำตามขั้นตอนด้านล่างเพื่อเรียนรู้วิธีสร้างการคำนวณรวม
- ใน Tableau Desktop ให้เชื่อมต่อกับแหล่งข้อมูลที่บันทึกไว้ ตัวอย่าง - Superstore ที่มาพร้อมกับ Tableau
- ไปที่เวิร์กชีต แล้วเลือกการวิเคราะห์ > สร้างฟิลด์ที่คำนวณ
- ในตัวแก้ไขการคำนวณที่เปิดขึ้น ให้ทำดังนี้
- ตั้งชื่อฟิลด์ที่คำนวณว่า Margin (ส่วนต่าง)
- ป้อนสูตรต่อไปนี้:
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
หมายเหตุ: คุณสามารถใช้การอ้างอิงฟังก์ชันในการค้นหาและเพิ่มฟังก์ชันการรวบรวมและฟังก์ชันอื่นๆ (เช่น ฟังก์ชัน IIF เชิงตรรกะในตัวอย่างนี้) ในสูตรการคำนวณ หากต้องการข้อมูลเพิ่มเติม โปรดดูใช้การอ้างอิงฟังก์ชันในตัวแก้ไขการคำนวณ
- เมื่อเสร็จแล้ว ให้คลิกตกลง
การคำนวณรวมใหม่จะปรากฏในส่วนการคำนวณในแผงข้อมูล คุณสามารถใช้ฟิลด์นี้ในการแสดงเป็นภาพได้มากกว่าหนึ่งรายการ เช่นเดียวกับฟิลด์อื่นๆ
หมายเหตุ: การคำนวณการรวมจะเป็นการวัดผลเสมอ
เมื่อวาง Margin ลงในแถบหรือการ์ดในเวิร์กชีต ชื่อจะเปลี่ยนเป็น AGG(Margin) ซึ่งจะบ่งชี้ว่าเป็นการคำนวณรวมและไม่สามารถรวมต่อไปได้อีก
กฎของการคำนวณรวม
การคำนวณรวมจะใช้กฎต่อไปนี้
- สำหรับการคำนวณรวมใดๆ คุณไม่สามารถรวมค่ารวมและค่าที่ไม่ใช่ค่ารวมเข้าด้วยกันได้ ตัวอย่างเช่น
SUM(Price)*[Items]
ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก SUM(Price) เป็นค่ารวมและ Items ไม่ใช่ค่ารวม อย่างไรก็ตาม ทั้งSUM(Price*Items)
และSUM(Price)*SUM(Items)
นั้นถูกต้อง - ค่าคงที่ในนิพจน์จะเป็นค่ารวมหรือไม่ใช่ค่ารวมก็ได้แล้วแต่ความเหมาะสม ตัวอย่างเช่น: ทั้ง
SUM(Price*7)
และSUM(Price)*7
เป็นนิพจน์ที่ถูกต้อง - ฟังก์ชันทั้งหมดสามารถประเมินได้จากค่ารวม อย่างไรก็ตาม อาร์กิวเมนต์ของฟังก์ชันที่กำหนดจะต้องเป็นค่ารวมทั้งหมดหรือไม่ใช่ค่ารวมทั้งหมด ตัวอย่างเช่น
MAX(SUM(Sales),Profit)
ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก Sales เป็นค่ารวมและ Profit ไม่ใช่ค่ารวม อย่างไรก็ตาม,MAX(SUM(Sales),SUM(Profit))
เป็นนิพจน์ที่ถูกต้อง - ผลลัพธ์ของการคำนวณรวมจะเป็นการวัดผลเสมอ ซึ่งรวมถึงนิพจน์ เช่น ATTR(Dimension) หรือ MIN(Dimension)
- เช่นเดียวกับการรวมที่กำหนดไว้ล่วงหน้า การคำนวณรวมจะมีการคำนวณอย่างถูกต้องสำหรับผลรวมทั้งหมด หากต้องการข้อมูลเพิ่มเติม โปรดดู “รวมทั้งหมด”
ดูเพิ่มเติม
ทำความเข้าใจการคำนวณ: การคำนวณรวม(ลิงก์จะเปิดในหน้าต่างใหม่)
การรวมข้อมูลใน Tableau(ลิงก์จะเปิดในหน้าต่างใหม่)