ความสัมพันธ์

ความสัมพันธ์คืออะไร:

ความสัมพันธ์หมายถึงความคล้ายคลึงกันหรือ ความสัมพันธ์ระหว่างสองสิ่งบุคคลหรือความคิด มันเป็นความคล้ายคลึงกันหรือความเท่าเทียมกันที่มีอยู่ระหว่างสองสมมติฐานที่แตกต่างกันสถานการณ์หรือวัตถุ

ในสาขาสถิติและคณิตศาสตร์ความสัมพันธ์หมายถึงการวัดระหว่างตัวแปรที่เกี่ยวข้องสองตัวหรือมากกว่า

คำว่าสหสัมพันธ์เป็นคำนามผู้หญิงที่มีต้นกำเนิดมาจากละติน correlatiōne

ความสัมพันธ์ของคำสามารถถูกแทนที่ด้วยคำเหมือนเช่น: ความสัมพันธ์, สมการ, เชื่อมต่อ, การติดต่อ, การเปรียบเทียบและการเชื่อมต่อ

ค่าสัมประสิทธิ์สหสัมพันธ์

ในสถิติ สัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน (r) ซึ่งเรียกอีกอย่างว่าสัมประสิทธิ์สหสัมพันธ์ของโมเมนต์ผลิตภัณฑ์เป็นการวัดความสัมพันธ์ระหว่างตัวแปรสองตัวในมาตรวัดตัวเดียวกัน

หน้าที่ของสัมประสิทธิ์สหสัมพันธ์คือการกำหนดความเข้มของความสัมพันธ์ที่มีอยู่ระหว่างชุดข้อมูลหรือข้อมูลที่ทราบ

ค่าของค่าสัมประสิทธิ์สหสัมพันธ์สามารถแตกต่างกันระหว่าง -1 และ 1 และผลที่ได้รับกำหนดว่าค่าสหสัมพันธ์เป็นลบหรือบวก

ในการตีความค่าสัมประสิทธิ์มีความจำเป็นที่จะต้องรู้ว่า 1 หมายความว่าความสัมพันธ์ระหว่างตัวแปรนั้นเป็น ค่าบวกที่สมบูรณ์แบบ และ -1 หมายความว่ามันเป็น ค่าลบที่สมบูรณ์แบบ หากค่าสัมประสิทธิ์เท่ากับ 0 หมายความว่าตัวแปรไม่ได้ขึ้นอยู่กับกันและกัน

ในสถิติยัง มีสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน ซึ่งมีชื่อนี้เพื่อเป็นเกียรติแก่นักสถิติชาร์ลส์สเปียร์แมน หน้าที่ของสัมประสิทธิ์นี้คือการวัดความเข้มของความสัมพันธ์ระหว่างสองตัวแปรไม่ว่าจะเป็นแบบเชิงเส้นหรือไม่ก็ตาม

ความสัมพันธ์ของสเปียร์แมนทำหน้าที่ประเมินว่าความรุนแรงของความสัมพันธ์ระหว่างตัวแปรที่วิเคราะห์ทั้งสองนั้นสามารถวัดได้ด้วยฟังก์ชั่นซ้ำซากจำเจ (ฟังก์ชั่นทางคณิตศาสตร์ที่สงวน

การคำนวณสัมประสิทธิ์สหสัมพันธ์เพียร์สัน

วิธีที่ 1) คำนวณหาค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันโดยใช้ความแปรปรวนร่วมและส่วนเบี่ยงเบนมาตรฐาน

ที่ไหน

S XY คือความแปรปรวนร่วม

S x และ S y แสดงถึงค่าเบี่ยงเบนมาตรฐานตามลำดับของตัวแปร x และ y

ในกรณีนี้การคำนวณเกี่ยวข้องกับการหาค่าความแปรปรวนร่วมระหว่างตัวแปรแรกกับค่าเบี่ยงเบนมาตรฐานของแต่ละตัวแปร จากนั้นความแปรปรวนร่วมจะถูกหารด้วยการคูณของส่วนเบี่ยงเบนมาตรฐาน

บ่อยครั้งที่ข้อความดังกล่าวแสดงให้เห็นถึงความเบี่ยงเบนมาตรฐานของตัวแปรหรือความแปรปรวนร่วมระหว่างพวกเขาเพียงแค่ใช้สูตร

วิธีที่ 2) การคำนวณสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันกับข้อมูลดิบ (โดยไม่มีความแปรปรวนร่วมหรือส่วนเบี่ยงเบนมาตรฐาน)

ด้วยวิธีนี้สูตรที่ตรงที่สุดจะเป็นดังนี้:

ตัวอย่างเช่นสมมติว่าเรามีข้อมูลที่มีการสังเกต n = 6 ของตัวแปรสองตัว: ระดับน้ำตาล (y) และอายุ (x) การคำนวณทำตามขั้นตอนต่อไปนี้:

ขั้นตอนที่ 1) สร้างตารางด้วยข้อมูลที่มีอยู่: i, x, y และเพิ่มคอลัมน์ว่างสำหรับ xy, x²และy²:

ขั้นตอนที่ 2: คูณ x และ y เพื่อเติมคอลัมน์ "xy" ตัวอย่างเช่นในบรรทัดที่ 1 เราจะมี: x1y1 = 43 × 99 = 4257

ขั้นตอนที่ 3: เพิ่มค่าของคอลัมน์ x และบันทึกผลลัพธ์ในคอลัมน์x² ตัวอย่างเช่นในบรรทัดแรกเราจะมี x 1 2 = 43 × 43 = 1849

ขั้นตอนที่ 4: ทำเช่นเดียวกับในขั้นตอนที่ 3 ตอนนี้ใช้คอลัมน์ y และบันทึกสแควร์ของค่าของคุณในคอลัมน์y² ตัวอย่างเช่นในบรรทัดแรกเราจะมี: y 1 2 = 99 × 99 = 9801

ขั้นตอนที่ 5: รับผลรวมของหมายเลขคอลัมน์ทั้งหมดและวางผลลัพธ์ในส่วนท้ายคอลัมน์ ตัวอย่างเช่นผลรวมของคอลัมน์อายุ X เท่ากับ 43 + 21 + 25 + 42 + 57 + 59 = 247

ขั้นตอนที่ 6: ใช้สูตรด้านบนเพื่อรับค่าสัมประสิทธิ์สหสัมพันธ์:

ดังนั้นเรามี:

สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน

การคำนวณสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนนั้นค่อนข้างแตกต่างกัน สำหรับสิ่งนี้เราต้องจัดระเบียบข้อมูลของเราในตารางต่อไปนี้:

1. เมื่อมีข้อมูล 2 คู่เราต้องแนะนำพวกมันในตาราง ตัวอย่างเช่น

2. ในคอลัมน์ "การจัดอันดับ A" เราจะจำแนกการสังเกตที่อยู่ใน "วันที่ A" ในลักษณะที่เพิ่มขึ้นโดยที่ "1" เป็นค่าต่ำสุดในคอลัมน์ en (จำนวนการสังเกตทั้งหมด) ซึ่งเป็นค่าสูงสุดในคอลัมน์ "วันที่ A " ในตัวอย่างของเราคือ:

3. เราทำเช่นเดียวกันเพื่อรับคอลัมน์ "อันดับ B" ตอนนี้ใช้การสังเกตในคอลัมน์ "Data B":

4. ในคอลัมน์ "d" เราให้ความแตกต่างระหว่างอันดับสอง (A - B) ที่นี่สัญญาณไม่สำคัญ

5. ยกแต่ละค่าในคอลัมน์ "d" และบันทึกในคอลัมน์d²:

6. เพิ่มข้อมูลทั้งหมดจากคอลัมน์ "d²" ค่านี้คือΣd² ในตัวอย่างของเราΣd² = 0 + 1 + 0 + 1 = 2

7. ตอนนี้เราใช้สูตรของ Spearman:

ในกรณีของเรา n เท่ากับ 4 ในขณะที่เราดูจำนวนแถวของข้อมูล (ซึ่งสอดคล้องกับจำนวนการสังเกต)

8. ในที่สุดเราจะแทนที่ข้อมูลในสูตรก่อนหน้า:

การถดถอยเชิงเส้น

การถดถอยเชิงเส้นเป็นสูตรที่ใช้ในการประมาณค่าที่เป็นไปได้ของตัวแปร (y) เมื่อทราบค่าของตัวแปรอื่น (x) ค่าของ "x" เป็นตัวแปรอิสระหรืออธิบายและ "y" เป็นตัวแปรหรือการตอบสนอง

การถดถอยเชิงเส้นจะใช้ในการตรวจสอบว่าค่าของ "y" สามารถแตกต่างกันเป็นฟังก์ชั่นของตัวแปร "x" บรรทัดที่มีค่าของการตรวจสอบความแปรปรวนเรียกว่าบรรทัดการถดถอยเชิงเส้น

หากตัวแปรอธิบาย "x" มีค่าเดียวการถดถอยจะถูกเรียกว่า การถดถอยเชิงเส้นอย่างง่าย