สถิติและข้อมูล
ความหมายของสถิติ
คำว่า สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistic มีรากศัพท์มาจาก
Stat หมายถึง ข้อมูล หรือ สารสนเทศ ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่างๆ
เช่น การทำสำมะโนครัว เพื่อทราบพลเมืองในประเทศทั้งหมด
ต่อมา
สถิติ หมายถึงตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน
อัตราการเกิดของเด็กทารก
ปริมาณน้ำฝนในแต่ละปี อาชีพที่นักเรียนม.6 โรงเรียนเทพศิรินทร์ร่มเกล้า
สนใจ สถิติในความหมายนี้ เรียกว่า ข้อมูลทางสถิติ (Statistical data) ซึ่งหมายถึง ข้อเท็จจริงที่เป็นตัวเลขหรือไม่เป็นตัวเลขก็ได้
ซึ่งต้องมีจำนวนมากและเก็บรวบรวมมาเพื่อสามารถนำไปใช้ในการเปรียบเทียบหรือตีความหมาย
อีกความหมายหนึ่ง
สถิติ หมายถึงศาสตร์ที่เป็นทั้งวิทยาศาสตร์และศิลปะที่ว่าด้วยการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล
การวิเคราะห์ข้อมูล และการตีความหมายข้อมูล
ประเภทของการวิเคราะห์ข้อมูล
การวิเคราะห์ข้อมูลแบ่งออกเป็น 2 ประเภท
คือ
1.สถิติเชิงพรรณนา
(Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่มหนึ่ง
ไม่สามารถอ้างอิงไปยังกลุ่มอื่นๆ ได้ สถิติที่อยู่ในประเภทนี้ เช่นค่าเฉลี่ย
ค่ามัธยฐาน ค่าฐานนิยม ส่วนเบี่ยงเบนมาตรฐาน พิสัย ฯลฯ สถิติเชิงพรรณนาจึงประกอบด้วย
±การนำเสนอข้อมูลโดยวิธีต่างๆ เช่น ตาราง แผนภูมิแท่ง
แผนภูมิรูปวงกลม กราฟเส้น
±ค่าวัดแนวโน้มสู่ศูนย์กลาง เช่น ค่าเฉลี่ยเลขคณิต
มัธยฐาน ฐานนิยม
±การวัดการกระจาย เช่น พิสัย ส่วนเบี่ยงเบนมาตรฐาน
ส่วนเบี่ยงเบนเฉลี่ย ค่ามาตรฐาน
2. สถิติเชิงอนุมาน
(Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่มหนึ่งหรือหลายกลุ่มแล้วสามารถอ้างอิงไปยังกลุ่มประชากรได้
โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของประชากร (เรียกว่ากลุ่มตัวอย่าง) ได้มาโดยวิธีการสุ่มตัวอย่าง
เช่นโรงเรียนแห่งหนึ่ง มีนักเรียนม.6 จำนวน 300 คน ถ้าครูคนหนึ่งต้องการทราบน้ำหนักเฉลี่ยของนักเรียนทั้งหมด
แต่ถ้าครูคนนี้ใช้สถิติมาอ้างอิงก็ไม่จำเป็นที่จะต้องชั่งน้ำหนักนักเรียนทั้ง 300 คน เพียงแค่สุ่มกลุ่มตัวอย่างของนักเรียนมาจำนวนหนึ่ง เช่นสุ่มนักเรียนมา
100 คน ชั่งน้ำหนักแล้วหาค่าเฉลี่ย สมมติว่าได้ 40 กิโลกรัม ครูก็สามารถสรุปผลด้างอิงไปถึงนักเรียนทั้ง 300 คนได้)
(นักเรียนคิดว่าน้ำหนักที่ได้สมเหตุสมผลหรือไม่อย่างไร????????????)
ความหมายของคำต่างๆ ที่ใช้ในวิชาสถิติ
ข้อมูล คือ
ข้อเท็จจริงต่างๆซึ่งอาจเป็นตัวเลขหรือไม่เป็นตัวเลขก็ได้
เกี่ยวกับเรื่องใดเรื่องหนึ่งที่เราสนใจ
การจำแนกข้อมูลโดยใช้เกณฑ์มี 2 ประเด็นคือ 1.ใช้เกณฑ์ลักษณะของข้อมูล 2.ใช้เกณฑ์ของแหล่งที่มาของข้อมูล
1.ใช้เกณฑ์ลักษณะของข้อมูล จะแบ่งข้อมูลได้ 2 ลักษณะคือ
1.1 ข้อมูลเชิงปริมาณ
หมายถึง ข้อมูลที่ใช้แทนขนาดหรือปริมาณ
ซึ่งวัดออกมาเป็นค่าของตัวเลขที่สามารถนำมาเปรียบเทียบได้ เช่น คะแนนสอบ อายุ
ความสูง น้ำหนัก รายได้ เป็นต้น
1.2 ข้อมูลเชิงคุณภาพ
หมายถึง ข้อมูลที่ไม่สามารถวัดออกมาเป็นตัวเลขได้ แต่จะอธิบายในเชิงคุณภาพได้ เช่น
เพศ
ศาสนา สัญชาติ ระดับการศึกษา อาชีพ ทะเบียนรถ ข้อมูลเชิงคุณภาพบางลักษณะสามารถวัดเป็นลำดับที่ได้
เช่น ระดับความพึงพอใจ ระดับความคิดเห็น (เห็นด้วยอย่างยิ่ง เห็นด้วย เฉยๆ
ไม่เห็นด้วย ไม่เห็นด้วยอย่างยิ่ง) เป็นต้น
2.ใช้เกณฑ์ของแหล่งที่มาของข้อมูลจะแบ่งข้อมูลเป็น 2 ประเภท คือ
2.1
ข้อมูลปฐมภูมิ คือ ข้อมูลซึ่งได้รับจากผู้ให้ข้อมูลโดยตรง เป็นข้อมูลที่ผู้รวบรวมข้อมูลทำการรวบรวมข้อมูลด้วยตนเอง
ข้อมูลปฐมภูมิได้จากการรวบรวมข้อมูล โดยวิธีการต่างๆ เช่น
- การสัมภาษณ์ เป็นการที่ผู้รวบรวมข้อมูลถามคำถามจากผู้ให้ข้อมูลโดยตรง ข้อมูลจึงเป็นคำตอบที่ผู้ให้ข้อมูลตอบออกมา
อาจเป็นการสัมภาษณ์โดยตรงหรือการสัมภาษณ์ทางโทรศัพท์ก็ได้ วิธีนี้เป็นที่นิยมมากที่สุด
เพราะได้รับคำตอบกลับคืนมามากที่สุด ข้อดีของวิธีนี้ คือถ้าผู้ให้ข้อมูลไม่เข้าใจคำถามสามารถสอบถามจากผู้รวบรวมข้อมูลได้
ข้อเสีย คือ ค่าใช้จ่ายสูง
- การใช้แบบสอบถาม เป็น การที่ผู้รวบรวมข้อมูลสร้างแบบสอบถามซึ่งการตอบนั้น ทำให้ได้รับข้อมูลที่ต้องการ
อาจเป็นการใช้แบบสอบถามโดยตรง หรือการใช้แบบสอบถามทางไปรษณีย์ ข้อดีของวิธีนี้ คือ
ประหยัดค่าใช้จ่าย ข้อเสียคือ กรณีส่งทางไปรษณีย์ ถ้าผู้ให้ข้อมูลไม่เข้าใจคำถาม จะไม่สามารถถามจากผู้รวบรวมข้อมูลได้
และแบบสอบถามที่ส่งไปบางส่วนอาจไม่ได้รับคืน
- การทดลอง เป็น การที่ผู้รวบรวมข้อมูลลงมือปฏิบัติเพื่อให้ได้ข้อมูลที่ต้องการ
การทดลองจึงมักเป็นการรวบรวมข้อมูลทางวิทยาศาสตร์ ข้อดีของวิธีนี้ คือ ข้อมูลที่ได้รับมีค่าความน่าเชื่อถือมากที่สุด
ข้อเสียนี้คือ การทดลองมีความคลาดเคลื่อนได้ ดังนั้นจึงต้องมีการควบคุม เพื่อให้ข้อมูลมีความน่าเชื่อถือ
- การสังเกต เป็น การที่ผู้รวบรวมข้อมูลสังเกตและบันทึกข้อมูล การรวบรวมข้อมูลวิธีนี้มักใช้ร่วมกับการรวบรวมข้อมูลวิธีอื่นเพื่อให้ได้ข้อมูลที่น่าเชื่อถือมากที่สุด
ซึ่งการเก็บรวบรวมข้อมูล สามารถทำได้ 2 รูปแบบ
2.1.1
การทำสำมะโน หมายถึง การเก็บรวบรวมข้อมูลจากทุกๆหน่วยของประชากร
จึงเป็นการเสียเวลาและค่าใช้จ่ายมาก จึงไม่ค่อยนิยมในทางปฏิบัติ เช่น
การทำสำมะโนประชากรไทย (พ.ศ.2553/____ และจัดเก็บทุกๆ __
ปี)
2.1.2
การสำรวจจากกลุ่มตัวอย่าง หมายถึง การเก็บรวบรวมข้อมูลจากบางหน่วย
ที่เลือกมาเป็นตัวแทนจากทุกๆหน่วยของประชากร
เนื่องจากไม่สามารถหาข้อมูลจากประชากรได้ทั้งหมด ซึ่งจะเสียเวลาและค่าใช้จ่ายมาก
2.2
ข้อมูลทุติยภูมิ เป็น ข้อมูลซึ่งได้จากผู้อื่นรวบรวมไว้แล้ว เช่น ข้อมูลจากสำนักงานสถิติแห่งชาติ
ข้อมูลจากอินเตอร์เน็ต รายงานของหน่วยงานเอกชนหรือองค์กรต่างๆซึ่งมักจะเผยแพร่เป็นรายวัน
รายเดือน หรือรายปี ข้อมูลความคิดเห็นจากสำนักโพลต่างๆ เป็นต้น
ประชากร
หมายถึง
กลุ่มของสิ่งต่างๆ ที่เราต้องการศึกษาทั้งหมด เช่น
- ถ้าเราสนใจเกี่ยวกับรายได้ของคนไทย
ประชากร คือ คนไทยทั้งหมดที่มีรายได้
- ถ้าเราสนใจเกี่ยวกับการเดินทางมาโรงเรียนของนักเรียนโรงเรียนเทพศิรินทร์ร่มเกล้า
ประชากร คือ ________________________ทั้งหมด
ดังนั้น ประชากรจึงเปรียบเสมือนกับเอกภพสัมพันธ์ในเซตที่เราศึกษา
กลุ่มตัวอย่าง หรือตัวอย่าง ซึ่งเป็นส่วนหนึ่งของประชากร การมีกลุ่มตัวอย่างเพราะในบางครั้ง
ประชากรที่เราต้องการศึกษามีจำนวนมาก แต่เราต้องการศึกษาบางประเด็นเกี่ยวกับประชากรกลุ่มนี้
ดังนั้นในทางปฏิบัติ เราไม่สะดวกที่จะศึกษาประชากรทั้งหมด
จึงมีการเลือกประชากรบางส่วนมาศึกษาเพื่อหาข้อสรุปทั้งหมดของกลุ่มประชากรโดยใช้เทคนิคการเลือกกลุ่มตัวอย่าง
เพื่อหาข้อมูลสรุปประเด็นปัญหาดังกล่าว และส่วนที่เราเลือกมา เรียกว่า ตัวอย่างหรือกลุ่มตัวอย่าง
ค่าพารามิเตอร์ หมายถึง ค่าต่างๆ ที่แสดงถึงลักษณะของประชากรซึ่งค่าต่างๆ
ดังกล่าวได้มาจากการนำข้อมูลจากประชากรมาคำนวณ เช่น “รายได้ของคนไทยในปี
พ.ศ.2560 โดยเฉลี่ยต่อคนต่อปีเท่ากับ
6,500 บาท” ในลักษณะ
นี้ค่าพารามิเตอร์
คือ
6,500 บาท ในบางครั้งไม่สามารถหาค่าพารามิเตอร์ได้
เพราะประชากรมีจำนวนมากเกินไป หรือไม่สามารถหาค่าพารามิเตอร์จากประชากรได้โดยตรง อาจจะหาได้จากค่าข้อมูลจากกลุ่มตัวอย่างแล้วมาอ้างอิงกลุ่มประชากร
โดยใช้สถิติขั้นสูงมาช่วยในการวิเคราะห์ก็ได้ ซึ่งค่าที่ได้มีความคลาดเคลื่อนไม่มากนัก
ค่าสถิติ คือ
ค่าต่างๆ ที่แสดงถึงลักษณะต่างๆ โดยภาพรวมของกลุ่มตัวอย่างที่ศึกษา ซึ่งค่าสถิติคำนวณมาจากข้อมูลของกลุ่มตัวอย่าง
ค่าที่ได้มา จะเป็นค่าที่ใกล้เคียงกับค่าพารามิเตอร์ เหมาะสมที่จะนำไปอธิบายลักษณะของประชากร
และ เรียกค่าที่ได้มานี้ว่า ค่าสถิติ