"ค่าเฉลี่ย" ไม่ใช่พระเจ้าของสถิติ
posted on 11 Jan 2009 22:13 by watchi in appliED-Mathภายในวันสองวันข้างหน้านี้ มีิคิวจะต้องสอนวิชาสถิติเบื้องต้นให้กับน้องๆมัธยมฯเค้า วันนี้ก็เลยลองเรียบเรียงความรู้เก่าเก็บของวิชาสถิติในหัวข้อ "ค่ากลาง" มาให้อ่านกัน
คำว่า "ค่ากลาง" ก็คือตัวแทนของข้อมูล
ทำไมต้องมีค่ากลางเป็นตัวแทนข้อมูล?
ยกตัวอย่างง่ายๆ สมมติมีคนทะลึ่งไปเก็บข้อมูลเป็นความยาวจู๋ของชายไทยมา 10,000 คน มันคงเป็นไปไม่ได้เลยที่เราจะมานั่งดูข้อมูลทั้ง 10,000 ตัวอย่างนี้
หรือต่อให้เราฟิตจัด นั่งเรียงดูความยาวจู๋รายคนจนครบ แต่ถามว่า แล้วไงล่ะ?
การดูข้อมูลทั้งหมด ไม่ได้บอกความเป็นไป หรือแนวโน้มที่จะทำให้เราวิเคราะห์ข้อมูลได้เลย
ซึ่งเราก็จะดูความเป็นไปและแนวโน้มของข้อมูลทั้งหมด จากสิ่งที่เรียกว่า ค่ากลาง นี้แหละ
,,, ,,, ,,,
สมัยเป็นหนุ่มสาวมัธยมฯ เราจะได้เรียนค่ากลางมาตรฐาน ทั้งหมด 3 แบบ ดังนี้
1.ค่าเฉลี่ยเลขคณิต (เรียกสั้นๆว่า ค่าเฉลี่ย)
อันนี้คุ้นกันมาตั้งแต่ไหนแต่ไร ผมเชื่อว่า ต่อให้เป็นคนที่ไม่ถนัดวิชาสถิติ ก็น่าจะหาค่าเฉลี่ยเป็น
ค่าเฉลี่ย หาได้จากผลรวมของข้อมูลหารด้วยจำนวนข้อมูล เช่น
จากการเก็บตัวอย่างข้อมูลความยาวของจู๋ผู้ชาย 5 คน ได้ข้อมูลดังนี้
5นิ้ว, 6นิ้ว, 5นิ้ว, 4นิ้ว และ 7 นิ้ว ตามลำดับ
ค่าเฉลี่ยของความยาวจู๋ = (ผลรวมความยาวจู๋)/(จำนวนจู๋) = (5+6+5+4+7)/(5) = 5.4 นิ้ว
,,, ,,, ,,,
2.ค่ามัธยฐาน
ค่ากลางค่านี้ คือค่าของชุดข้อมูลที่เรียงแล้ว ณ ตำแหน่งที่อยู่ตรงกลางพอดี เช่น
จากการเก็บตัวอย่างข้อมูลความยาวของจู๋ผู้ชาย 5 คน ได้ข้อมูลดังนี้
5นิ้ว, 6นิ้ว, 5นิ้ว, 4นิ้ว และ 7 นิ้ว ตามลำดับ
เมื่อเรานำจู๋มาเรียงตามความยาว ก็จะได้ดังนี้
4นิ้ว, 5นิ้ว, 5นิ้ว, 6นิ้ว และ 7นิ้ว
เนื่องจากข้อมูล มี 5 ตัวอย่าง ดังนั้นตำแหน่งที่อยู่ตรงกลางก็คือตำแหน่งที่สาม ซึ่งก็คือ 5 นิ้ว นั้นเอง
หมายความว่า ค่ามัธยฐานของข้อมูลชุดนี้ มีค่าเท่ากับ 5 นิ้ว
อนึ่ง ตำแหน่งของมัธยฐานหาได้จาก (จำนวนของข้อมูล+1)/2
ข้อมูลข้างบนจำนวนข้อมูลเท่ากับ 5 ดังนั้นตำแหน่งของมัธยฐานก็คือ (5+1)/2 = 3
สมมติว่าไปเก็บข้อมูลมาเพิ่มอีก 1 จู๋ ได้ข้อมูลมาเป็น 9 นิ้ว (ลูกครึ่งนิโกรแหงมๆ -..-) เราจะได้จำนวนของข้อมูลชุดนี้มา 6 ตัวอย่างดังนี้
4นิ้ว, 5นิ้ว, 5นิ้ว, 6นิ้ว, 7นิ้ว, 9นิ้ว
สังเกตว่า จุดกึ่งกลางของตำแหน่งข้อมูลคือตำแหน่งที่สามครึ่ง
คำนวณหาตำแหน่ง จะได้เป็น (6+1)/2=3.5
ในการหาค่าข้อมูลของตำแหน่งสามครึ่ง ให้นำข้อมูลในตำแหน่งที่สาม (5นิ้ว) บวกกับข้อมูลในตำแหน่งที่สี่ (6นิ้ว) แล้วหารด้วย 2 จะได้ค่ามัธยฐานออกมาเป็น (5+6)/2=5.5นิ้ว
,,, ,,, ,,,
3.ฐานนิยม
ชื่อก็บอกอยู่แล้วว่า ฐานนิยม เราก็จะเลือกข้อมูลที่นิยมที่สุด หรือมีจำนวนความถี่สูงสุดมาเป็นค่ากลางของข้อมูล เช่น
จากการเก็บตัวอย่างข้อมูลความยาวของจู๋ผู้ชาย 5 คน ได้ข้อมูลดังนี้
5นิ้ว, 6นิ้ว, 5นิ้ว, 4นิ้ว และ 7 นิ้ว ตามลำดับ
เนื่องจาก มีจำนวนจู๋ที่มีความยาว 5 นิ้วเยอะที่สุด ดังนั้น ฐานนิยมของจู๋ชุดนี้ ก็คือ 5 นิ้ว
,,, ,,, ,,,
ระวัง!!!!!
ใช้ให้เป็น ใช้ให้ถูก
"ค่าเฉลี่ย" ไม่ใช่พระเจ้าของสถิติ
ที่ผมจั่วหัวไว้อย่างนี้เนื่องมากจากว่า ถ้าพูดถึง ค่ากลางทางสถิติ หลายๆคนก็มักจะนึกถึง ค่าเฉลี่ยโลด ทั้งๆที่ความเป็นจริงแล้ว การเืลือกใช้ค่ากลางนั้น ต้องดูความเหมาะสมเป็นกรณีไป
ยกตัวอย่างเช่น
จากการเก็บข้อมูลเงินเดือนของคน 5 คน ได้ข้อมูลดังนี้
8พันบาท, 9พันบาท, 9พันบาท, 1หมื่นบาท และ 2แสนบาท
ถ้าเราหาค่าเฉลี่ยของเงินเดือนเราก็จะได้
(8000+9000+9000+10000+200000)/5= 47400
ถ้าเราเลือกใช้ค่าเฉลี่ยเป็นค่ากลาง เราจะสรุปว่า คน 5 คนนี้ มีเงินเดือนเฉลี่ย 47,400 บาท
คิดว่าข้อสรุปนี้ น่าเชื่อถือไหมหนอ?
คำตอบก็คือ ไม่เลย!!!
นั่นก็เพราะค่า 47,000 อยู่ห่างจากค่าข้อมูลที่กระจุกกันอยู่ส่วนใหญ่ ได้แก่ 8พันบาท, 9พันบาท, 9พันบาท, 1หมื่นบาท เกินความเป็นจริงนั่นเอง
แต่ถ้าเราใช้ค่ามัธยฐาน จะได้ค่ามัธยฐานเป็น 9,000 ซึ่งจะมีความน่าเชื่อถือในการเป็นค่ากลางของข้อมูลชุดนี้มากกว่า
ดังนั้น ถ้าข้อมูลมีตัวอย่างข้อมูลที่มีค่ากระโดดจากตัวอย่างอื่นมากๆ ควรหลีกเลี่ยงการใช้ค่าเฉลี่ย เพราะจะทำให้ค่าเฉลี่ยที่ออกมา อาจกระโดดจากข้อมูลส่วนใหญ่
,,, ,,, ,,,
ตัวอย่างต่อไป ผมอยากจะขอยกตัวอย่าง เป็นการเก็บข้อมูลศิลปินที่ชอบ ของเด็ก 5 คนได้ข้อมูลดังนี้
เกิลรี่เบอรี่, เกิลรี่เบอรี่, โฟร์มด, เนโกะจัมพ์, จินตหรา พูนลาภ
คำถามคือ เรา จะหาค่าเฉลี่ย หรือค่ามัธยฐานได้หรือไม่?
คำตอบคือ ไม่มีทาง เพราะข้อมูลที่ได้มา ไม่ใช่ตัวเลข เราไม่มีทางที่จะคำนวณหาค่าเฉลี่ย หรือ เรียงข้อมูลเพื่อหาตำแหน่งตรงกลางของค่ามัธยฐานได้เลย
ข้อมูลในทางสถิติ มี สองแบบ ได้แก่ ข้อมูลเชิงปริมาณ แปลเป็นภาษาชาวบ้าน ก็คือ ข้อมูลที่เป็ยตัวเลข สามารถเอาไปคำนวณ บวก ลบ คูณ หาร หรือเปรียบเทียบเพื่อเรียงกันได้ เช่น ความสูง, ความยาว, น้ำหนัก
ข้อมูลอีกแบบนึงเรียกว่า ข้อมูลเชิงคุณภาพ แปลเป็นภาษาชาวบ้าน ก็คือ ข้อมูลที่บ่งบอกลักษณะ และไม่ใช่ตัวเลข เช่น สี, ชื่อ, ยี่ห้อ
ถ้าข้อมูลเป็นข้อมูลเชิงคุณภาพ เราไม่มีทางที่จะคำนวณมันได้
ยกตัวอย่างเช่น เกิลรี่เบอรี่บวกกับโฟร์มดแล้วเอาไปหารสอง ก็คงไม่ได้จินตหราขึ้นมา
ในกรณีแบบนี้ เราจะต้องใช้ฐานนิยมเป็นค่ากลางสถานเดียว นั่นก็คือ เลือกเอาตัวอย่างที่มีความนิยมสูงสุด
ในกรณีนี้ เราจะได้ฐานนิยม เป็น เกิลรี่เบอรี่นั่นเอง (ชอบส่วนตัว ใครจะทำไม!!!)
หมายเห็ด : การใช้ ฐานนิยม ที่ทุกคนคุ้นเคยกันเป็นอย่างดี ก็คือ การเลือกตั้ง นี่เองงงง
จำสูตรเยอะดีนักแล
#1 By O ช้างต้น on 2009-01-11 23:06