ฟังก์ชันการรวบรวมใน Tableau
บทความนี้จะอธิบายฟังก์ชันการรวบรวมและการใช้งานใน Tableau และจะสาธิตวิธีสร้างการคำนวณรวมโดยใช้ตัวอย่าง
ทำไมจึงควรใช้ฟังก์ชันการรวบรวม
ฟังก์ชันการรวบรวมจะช่วยสรุปหรือเปลี่ยนแปลงมุมมองแบบละเอียดของข้อมูลให้คุณได้
ตัวอย่างเช่น คุณอาจจะอยากทราบจำนวนคำสั่งซื้อที่ร้านค้าของคุณได้รับในปีนั้นๆ คุณก็สามารถใช้ฟังก์ชัน COUNTD เพื่อสรุปจำนวนคำสั่งซื้อที่แน่นอนที่บริษัทของคุณได้รับ จากนั้นแยกย่อยภาพข้อมูลในแต่ละปีได้
การคำนวณอาจมีลักษณะดังนี้:
COUNTD(Order ID)
การแสดงเป็นภาพอาจมีลักษณะดังนี้:
ฟังก์ชันการรวบรวมที่มีอยู่ใน Tableau
การรวมและเลขทศนิยม: ผลลัพธ์ของการรวมบางรายการอาจไม่ตรงตามที่คุณคาดไว้เสมอไป ตัวอย่างเช่น คุณอาจพบว่าฟังก์ชัน “ผลรวม” มีการส่งคืนค่าเช่น -1.42e-14 สำหรับคอลัมน์ของตัวเลขที่คุณรู้ว่าควรรวมแล้วเท่ากับ 0 ซึ่งเกิดขึ้นเนื่องจากมาตรฐานค่าทศนิยมของ Institute of Electrical and Electronics Engineers (IEEE) 754 กำหนดให้จัดเก็บตัวเลขในรูปแบบไบนารี จึงหมายความว่า บางครั้งตัวเลขจะถูกปัดเศษในระดับความแม่นยำที่ละเอียดมาก คุณสามารถกำจัดสิ่งรบกวนที่อาจเกิดขึ้นเหล่านี้ได้โดยใช้ฟังก์ชัน ROUND (ดูฟังก์ชันตัวเลข) หรือโดยการจัดรูปแบบตัวเลขเพื่อแสดงตำแหน่งทศนิยมให้น้อยลง
ATTR
ไวยากรณ์ | ATTR(expression) |
คำนิยาม | แสดงค่าของนิพจน์หากมีค่าเดียวสำหรับแถวทั้งหมด หรือแสดงเป็นดอกจัน ค่า null จะถูกละเว้น |
AVG
ไวยากรณ์ | AVG(expression) |
คำนิยาม | แสดงค่าเฉลี่ยของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น |
หมายเหตุ | AVG ใช้ได้กับฟิลด์ตัวเลขเท่านั้น |
เก็บ
ไวยากรณ์ | COLLECT(spatial) |
คำนิยาม | การคำนวณรวมที่รวมค่าในฟิลด์อาร์กิวเมนต์ ค่า null จะถูกละเว้น |
หมายเหตุ | COLLECT ใช้ได้กับฟิลด์เชิงพื้นที่เท่านั้น |
CORR
ไวยากรณ์ | CORR(expression1, expression2) |
เอาต์พุต | ตัวเลขตั้งแต่ -1 ถึง 1 |
คำนิยาม | แสดงค่าสัมประสิทธิ์สหสัมพันธ์ของ Pearson ของนิพจน์สองรายการ |
ตัวอย่าง | example |
หมายเหตุ | สหสัมพันธ์ของ Pearson วัดความสัมพันธ์เชิงเส้นระหว่างสองตัวแปร ผลลัพธ์อยู่ในช่วงตั้งแต่ -1 ถึง +1 โดยรวม ซึ่ง 1 บ่งบอกถึงความสัมพันธ์เชิงเส้นทางบวกอย่างแน่นอน 0 บ่งบอกว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปร และ −1 คือความสัมพันธ์ทางลบอย่างแน่นอน กำลังสองของผลลัพธ์ CORR เทียบเท่ากับค่า R-Squared สำหรับแบบจำลองเส้นแนวโน้มแบบเชิงเส้น ดูข้อกำหนดของแบบจำลองเส้นแนวโน้ม(ลิงก์จะเปิดในหน้าต่างใหม่) ใช้กับนิพจน์ LOD ที่กำหนดขอบเขตตาราง: คุณสามารถใช้ CORR เพื่อแสดงความสัมพันธ์เป็นภาพในการกระจายแบบแยกส่วนโดยใช้ระดับของนิพจน์รายละเอียดในขอบเขตตาราง(ลิงก์จะเปิดในหน้าต่างใหม่) ตัวอย่าง: {CORR(Sales, Profit)} เมื่อใช้นิพจน์ระดับรายละเอียด จะเป็นการเรียกใช้สหสัมพันธ์ในทุกแถว หากคุณใช้สูตรอย่างเช่น |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ |
COUNT
ไวยากรณ์ | COUNT(expression) |
คำนิยาม | แสดงจำนวนรายการ ค่า null จะไม่ถูกนับ |
COUNTD
ไวยากรณ์ | COUNTD(expression) |
คำนิยาม | แสดงจำนวนรายการที่ต่างกันในกลุ่ม ค่า null จะไม่ถูกนับ |
COVAR
ไวยากรณ์ | COVAR(expression1, expression2) |
คำนิยาม | แสดงค่าความแปรปรวนร่วมเกี่ยวตัวอย่างของสองนิพจน์ |
หมายเหตุ | ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวตัวอย่างใช้จำนวนจุดข้อมูลที่ไม่ใช่ค่า ืnull n - 1 เพื่อสร้างมาตรฐานการคำนวณค่าความแปรปรวนร่วมเกี่ยว แทนที่จะใช้ n ซึ่งใช้ในค่าความแปรปรวนร่วมเกี่ยวประชากร (มีให้ใช้งานในฟังก์ชัน หาก ค่าของ |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ |
COVARP
ไวยากรณ์ | COVARP(expression 1, expression2) |
คำนิยาม | แสดงค่าความแปรปรวนร่วมเกี่ยวประชากรของสองนิพจน์ |
หมายเหตุ | ค่าความแปรปรวนร่วมเกี่ยวแสดงปริมาณที่สองตัวแปรเปลี่ยนแปลงร่วมกัน ค่าความแปรปรวนร่วมเกี่ยวเชิงบวกบ่งบอกว่าตัวแปรมีแนวโน้มจะเคลื่อนไปในทิศทางเดียวกัน เมื่อค่าตัวแปรหนึ่งที่มีขนาดใหญ่ขึ้นมีแนวโน้มจะสอดคล้องกับค่าของอีกตัวแปรที่มีขนาดใหญ่ขึ้นโดยเฉลี่ย ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นค่าความแปรปรวนร่วมเกี่ยวตัวอย่างคูณด้วย (n-1)/n ซึ่งเป็นจำนวนรวมของจุดข้อมูลที่ไม่ใช่ค่า Null ค่าความแปรปรวนร่วมเกี่ยวประชากรเป็นตัวเลือกที่เหมาะสมเมื่อมีข้อมูลให้ใช้งานสำหรับรายการที่สนใจทั้งหมด ซึ่งตรงข้ามกับกรณีที่มีเฉพาะเซตย่อยของรายการแบบสุ่ม ซึ่งจะเหมาะกับค่าความแปรปรวนร่วมเกี่ยวตัวอย่าง (ที่มีฟังก์ชัน หาก |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลอื่นๆ ให้พิจารณาแยกข้อมูลหรือใช้ |
MAX
ไวยากรณ์ | MAX(expression) หรือ MAX(expr1, expr2) |
เอาต์พุต | ประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ NULL หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null |
คำนิยาม | แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน
|
ตัวอย่าง | MAX(4,7) = 7 |
หมายเหตุ | สำหรับสตริง โดยปกติ สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง สำหรับวันที่ สำหรับวันที่ เป็นการรวบรวม
เป็นการเปรียบเทียบ
ดูเพิ่มเติมที่ |
ค่ามัธยฐาน
ไวยากรณ์ | MEDIAN(expression) |
คำนิยาม | แสดงค่ามัธยฐานของนิพจน์ในระเบียนทั้งหมด ค่า null จะถูกละเว้น |
หมายเหตุ | MEDIAN ใช้ได้กับฟิลด์ตัวเลขเท่านั้น |
ข้อจำกัดของฐานข้อมูล |
สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่) |
MIN
ไวยากรณ์ | MIN(expression) หรือ MIN(expr1, expr2) |
เอาต์พุต | ประเภทข้อมูลเดียวกันกับอาร์กิวเมนต์หรือ NULL หากส่วนใดส่วนหนึ่งของอาร์กิวเมนต์เป็นค่า null |
คำนิยาม | แสดงค่าสูงสุดของสองอาร์กิวเมนต์ ซึ่งต้องเป็นประเภทข้อมูลเดียวกัน
|
ตัวอย่าง | MIN(4,7) = 4 |
หมายเหตุ | สำหรับสตริง โดยปกติแล้ว สำหรับแหล่งข้อมูลของฐานข้อมูล ค่าสตริง สำหรับวันที่ สำหรับวันที่ เป็นการรวบรวม
เป็นการเปรียบเทียบ
ดูเพิ่มเติมที่ |
PERCENTILE
ไวยากรณ์ | PERCENTILE(expression, number) |
คำนิยาม | แสดงค่าเปอร์เซ็นต์ไทล์จากนิพจน์ที่กำหนดซึ่งสอดคล้องกับ <number> ที่ระบุ <number> ต้องอยู่ระหว่าง 0 ถึง 1 (โดยรวม) และต้องเป็นค่าตัวเลขคงที่ |
ตัวอย่าง | PERCENTILE([Score], 0.9) |
หมายเหตุ | |
ข้อจำกัดของฐานข้อมูล | ฟังก์ชันนี้ใช้ได้กับแหล่งข้อมูลต่อไปนี้: การเชื่อมต่อ Microsoft Excel และไฟล์ข้อความที่ไม่ใช่แบบเดิม, การแยกข้อมูลและการแยกข้อมูลประเภทแหล่งข้อมูลเท่านั้น (เช่น Google Analytics, OData หรือ Salesforce), แหล่งข้อมูล Sybase IQ 15.1 ขึ้นไป, แหล่งข้อมูล Oracle 10 ขึ้นไป, แหล่งข้อมูล Cloudera Hive และ Hortonworks Hadoop Hive, EXASolution 4.2 ขึ้นไป สำหรับแหล่งข้อมูลประเภทอื่นๆ คุณสามารถแยกข้อมูลของคุณลงในไฟล์การแยกข้อมูลเพื่อใช้ฟังก์ชันนี้ได้ ดูแยกข้อมูลของคุณ(ลิงก์จะเปิดในหน้าต่างใหม่) |
STDEV
ไวยากรณ์ | STDEV(expression) |
คำนิยาม | แสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร |
STDEVP
ไวยากรณ์ | STDEVP(expression) |
คำนิยาม | แสดงค่าเบี่ยงเบนมาตรฐานทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรที่ได้รับการชดเชย |
SUM
ไวยากรณ์ | SUM(expression) |
คำนิยาม | แสดงผลรวมของค่าทั้งหมดในนิพจน์ ค่า null จะถูกละเว้น |
หมายเหตุ | SUM ใช้ได้กับฟิลด์ตัวเลขเท่านั้น |
VAR
ไวยากรณ์ | VAR(expression) |
คำนิยาม | แสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามตัวอย่างของประชากร |
VARP
ไวยากรณ์ | VARP(expression) |
คำนิยาม | แสดงค่าความแปรปรวนทางสถิติของค่าทั้งหมดในนิพจน์ที่กำหนดตามประชากรทั้งหมด |
สร้างการคำนวณรวม
ทำตามขั้นตอนด้านล่างเพื่อเรียนรู้วิธีสร้างการคำนวณรวม
ใน Tableau Desktop ให้เชื่อมต่อกับแหล่งข้อมูลที่บันทึกไว้ ตัวอย่าง - Superstore ที่มาพร้อมกับ Tableau
ไปที่เวิร์กชีต แล้วเลือกการวิเคราะห์ > สร้างฟิลด์ที่คำนวณ
ในตัวแก้ไขการคำนวณที่เปิดขึ้น ให้ทำดังนี้
ตั้งชื่อฟิลด์ที่คำนวณว่า Margin (ส่วนต่าง)
ป้อนสูตรต่อไปนี้:
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
หมายเหตุ: คุณสามารถใช้การอ้างอิงฟังก์ชันในการค้นหาและเพิ่มฟังก์ชันการรวบรวมและฟังก์ชันอื่นๆ (เช่น ฟังก์ชัน IIF เชิงตรรกะในตัวอย่างนี้) ในสูตรการคำนวณ หากต้องการข้อมูลเพิ่มเติม โปรดดูใช้การอ้างอิงฟังก์ชันในตัวแก้ไขการคำนวณ
เมื่อเสร็จแล้ว ให้คลิกตกลง
การคำนวณรวมใหม่จะปรากฏในส่วนการคำนวณในแผงข้อมูล คุณสามารถใช้ฟิลด์นี้ในการแสดงเป็นภาพได้มากกว่าหนึ่งรายการ เช่นเดียวกับฟิลด์อื่นๆ
หมายเหตุ: การคำนวณการรวมจะเป็นการวัดผลเสมอ
เมื่อวาง Margin ลงในแถบหรือการ์ดในเวิร์กชีต ชื่อจะเปลี่ยนเป็น AGG(Margin) ซึ่งจะบ่งชี้ว่าเป็นการคำนวณรวมและไม่สามารถรวมต่อไปได้อีก
กฎของการคำนวณรวม
การคำนวณรวมจะใช้กฎต่อไปนี้
สำหรับการคำนวณรวมใดๆ คุณไม่สามารถรวมค่ารวมและค่าที่ไม่ใช่ค่ารวมเข้าด้วยกันได้ ตัวอย่างเช่น SUM(Price)*[Items] ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก SUM(Price) เป็นค่ารวมและ Items ไม่ใช่ค่ารวม อย่างไรก็ตาม SUM(Price*Items) และ SUM(Price)*SUM(Items) นั้นใช้ได้ทั้งคู่
ค่าคงที่ในนิพจน์จะเป็นค่ารวมหรือไม่ใช่ค่ารวมก็ได้แล้วแต่ความเหมาะสม ตัวอย่างเช่น SUM(ราคา*7) และ SUM(ราคา)*7 เป็นนิพจน์ที่ถูกต้องทั้งคู่
ฟังก์ชันทั้งหมดสามารถประเมินได้จากค่ารวม อย่างไรก็ตาม อาร์กิวเมนต์ของฟังก์ชันที่กำหนดจะต้องเป็นค่ารวมทั้งหมดหรือไม่ใช่ค่ารวมทั้งหมด ตัวอย่างเช่น: MAX(SUM(Sales),Profit) ไม่ใช่นิพจน์ที่ถูกต้องเนื่องจาก Sales เป็นค่ารวมแต่ Profit ไม่ใช่ค่ารวม อย่างไรก็ตาม MAX(SUM(Sales),SUM(Profit)) เป็นนิพจน์ที่ถูกต้อง
ผลลัพธ์ของการคำนวณรวมจะเป็นการวัดผลเสมอ
เช่นเดียวกับการรวมที่กำหนดไว้ล่วงหน้า การคำนวณรวมจะมีการคำนวณอย่างถูกต้องสำหรับผลรวมทั้งหมด หากต้องการข้อมูลเพิ่มเติม โปรดดู “รวมทั้งหมด”
ดูเพิ่มเติม
ทำความเข้าใจการคำนวณ: การคำนวณรวม(ลิงก์จะเปิดในหน้าต่างใหม่)
การรวมข้อมูลใน Tableau(ลิงก์จะเปิดในหน้าต่างใหม่)