Phân Tích Tương Quan Là Gì

     

Phân tích đối sánh tương quan Pearson r (cung cấp một hệ số tương quan Pearson, được ký hiệu là r) là thước đo độ mạnh của mối link tuyến tính giữa hai biến. Về cơ bản, sự đối sánh tương quan Pearson nỗ lực vẽ một đường tương xứng nhất trải qua dữ liệu của hai biến và hệ số tương quan Pearson, r, cho biết thêm khoảng cách toàn bộ các điểm tài liệu này đến đường tương xứng nhất này (tức là các điểm dữ liệu này giỏi như nắm nào với quy mô / mặt đường mới phù hợp nhất).

Bạn đang xem: Phân tích tương quan là gì

1. Lúc nào sử dụng?

Phân tích đối sánh tương quan Pearson, r, rất có thể được áp dụng làm ước lượng mẫu mã cho đối sánh tương quan dân số, ρ (rho). Nó là 1 trong những chỉ số không tồn tại thứ nguyên về mối quan hệ tuyến tính thân hai đổi mới ngẫu nhiên, giá chỉ trị bởi 0 có nghĩa là không có mối quan hệ tuyến tính giữa các biến và giá trị bằng 1 cho thấy thêm mối quan lại hệ đường tính trả hảo. Trường hợp mối đối sánh là âm, tức là giá trị tăng trên một phát triển thành được kết hợp với giá trị giảng trên vươn lên là kia. Giá trị của r bao gồm thể biến hóa giữa −1 và +1 bất cứ kích thước đo lường và thống kê của nhị biến.

Tương quan tiền Pearson, r, buộc phải được coi là một thống kê diễn đạt (descriptive statistic) khi 1 nhà phân tích muốn định lượng cường độ của mối quan hệ tuyến tính giữa những biến. Một tương quan tham số sẽ thích hợp bất cứ khi nào các phép đo định lượng được tiến hành đồng thời trên hai hoặc nhiều biến, quan hệ giữa hai trở thành là con đường tính và cả hai đổi thay đều được cung cấp chuẩn. Những mối đối sánh phải luôn luôn được đánh giá trước khi tiến hành các phân tích nhiều biến phức tạp hơn, ví dụ như phân tích yếu tố (factor analysis) hoặc đối chiếu thành phần thiết yếu (principal component analysis). Mức độ của quan hệ tuyến tính thân hai trở thành số có thể khó reviews từ biểu thiết bị phân tán và hệ số tương quan cung ứng một phiên bản tóm tắt gọn gàng hơn. Mặc dù nhiên, sẽ không còn khôn ngoan nếu cố gắng tính toán mối đối sánh tương quan khi biểu trang bị phân tán thể hiện một quan hệ phi con đường tính rõ ràng. Khi một nhà nghiên cứu suy nghĩ cả mức khoảng tầm rộng và chân thành và ý nghĩa của một mối đối sánh thì r được sử dụng theo phong cách suy diễn như một cầu lượng của mối đối sánh dân số, ρ (rho).

Công thức tính hệ số đối sánh tương quan Pearson trong hai trở nên x với y từ bỏ n chủng loại như sau:

*

2. Trả thuyết vô hiệu hóa và suy luận thống kê

Khi ước lượng form size của mối tương quan dân số, chúng ta cũng có thể muốn kiểm soát xem nó có ý nghĩa sâu sắc thống kê giỏi không. Mang thuyết loại bỏ là H0: ρ = 0, nghĩa là, thay đổi X không liên quan tuyến tính với biến đổi Y. Mang thuyết thay thế là H1: ρ ≠ 0. Trả thuyết vô hiệu là 1 trong những phép kiểm tra xem có ngẫu nhiên mối quan liêu hệ cụ thể nào giữa các biến X và Y có thể phát sinh một cách tình cờ hay không. Trưng bày mẫu của r là không chuẩn khi đối sánh tương quan dân số lệch ngoài 0 và khi kích thước mẫu bé dại (n Fisher’s z.

3. Các giả định thống kê

Trong một số trong những sách thống kê giành cho các nhà khoa học xã hội, fan ta xác minh rằng để sử dụng mối đối sánh tương quan Pearson, cả hai biến phải bao gồm phân phối chuẩn, nhưng trong những văn bạn dạng khác, nó nói rằng phân phối của tất cả hai biến phải đối xứng (symmetrical) và đối chọi phương (unimodal) cơ mà không nhất thiết bắt buộc chuẩn. Những ý kiến này gây hoang mang và sợ hãi lớn cho những nhà nghiên cứu và cần được thiết kế rõ. Ví như thống kê tương quan chỉ được áp dụng cho mục tiêu mô tả thì không quan trọng phải sử dụng những giả định chuẩn chỉnh về hình thức (form) của trưng bày dữ liệu. Những giả định tuyệt nhất được yêu ước là:

các phép đo định lượng (mức khoảng tầm hoặc mức xác suất của phép đo) được triển khai đồng thời trên hai hoặc nhiều biến chuyển ngẫu nhiên. Tức là hai biến bắt buộc được thống kê giám sát trên thang đo khoảng chừng hoặc tỷ lệ. Tuy nhiên, cả nhì biến không cần phải được giám sát trên và một thang đo (ví dụ, một biến rất có thể là xác suất và một có thể là khoảng).các phép đo bắt cặp cho mỗi đối tượng (ví dụ, mỗi người tham gia) là độc lập. Ví dụ, bạn đã thu thập thời hạn ôn tập (tính bởi giờ) và công dụng thi (đo trường đoản cú 0 mang lại 100) từ bỏ 100 sinh viên được lấy mẫu bất chợt tại một trường đh (tức là chúng ta có hai phát triển thành liên tục: “thời gian ôn tập” cùng “kỳ thi hiệu suất”). Mỗi cá nhân trong số 100 sinh viên sẽ sở hữu một quý hiếm về thời gian ôn tập (ví dụ: “sinh viên số 1” đã học vào “23 giờ”) và kết quả bài soát sổ (ví dụ: “sinh viên số 1” đạt “81/100”). Bởi đó, các bạn sẽ có 100 cực hiếm được ghép nối.

Các hiệu quả thu được sẽ diễn tả mức độ mà quan hệ tuyến tính được áp dụng cho tài liệu mẫu.

Ngoài ra, bắt buộc nhận xét cẩn trọng về việc áp dụng r. Đây không hẳn là đông đảo giả định nghiêm nhặt nhưng trong những tình huống nghiên cứu điển hình khi r hoặc là đề xuất được lý giải một giải pháp thận trọng, hoặc không nên sử dụng.

Khi phương sai của nhị thước đo rất khác nhau, thường liên quan đến những phạm vi khác biệt hoặc hoàn toàn có thể là một phạm vi giới hạn cho một biến, thì mối đối sánh mẫu vẫn bị hình ảnh hưởng. Ví dụ: nếu như một đổi mới bị hạn chế phạm vi, (một phần của phạm vi điểm số ko được thực hiện hoặc không phù hợp) thì điều này sẽ sở hữu xu phía làm giảm (thấp hơn) mối đối sánh giữa nhị biến.Khi có các giá trị nước ngoài lệ, r nên được giải thích một giải pháp thận trọng.Khi các quan liền kề được mang từ một đội nhóm không đồng nhất (heterogeneous). Nếu giỏi nhất, dữ liệu nên là đồng tốt nhất (homoscedasticity). Đồng tốt nhất trong tương quan tức là các phương không đúng dọc theo mặt đường của sự cân xứng nhất vẫn tương tự như khi dịch rời dọc theo đường. Nếu các phương sai không giống nhau thì tất cả phương sai biến hóa (hay nói một cách khác heteroscedasticity). Đồng tốt nhất (hay độ giãn nở đồng nhất) được thể hiện dễ dãi nhất bởi sơ đồ, như hình bên dưới đây:

*

Khi tài liệu thưa thớt (có quá không nhiều số đo), r không nên được sử dụng. Với quá ít giá bán trị, cấp thiết nói liệu quan hệ hai biến tất cả tuyến tính tốt không. Tương quan Pearson r là phù hợp nhất cho các mẫu to hơn (n> 30).Không đề xuất sử dụng tương quan r khi các giá trị trên một trong các biến đã được cố định và thắt chặt trước.

4. Phân tích đối sánh tương quan Pearson r trong SPSS

Ví dụ, một nhà nghiên cứu và phân tích muốn biết liệu tác dụng kỳ thi viết cuối kì môn Toán phân tích và lý giải có tương quan với thời hạn ôn tập cuối kì của những sinh viên tuyệt không. Có đôi mươi sinh viên được mời thâm nhập một cuộc test nghiệm, kể từ lúc bài học tập của môn Toán giải tích kết kết cho ngày thi cuối kì, bọn họ được đề nghị đánh dấu tổng khoảng thời gian ôn bài (cộng dồn của từng ngày) dành riêng cho môn Toán. Ngừng kì thi, nhà nghiên cứu thu thập điểm số của trăng tròn sinh viên này theo thang điểm 100, với tổng đúng theo theo bảng bên dưới đây.

*

Hai thắc mắc nghiên cứu được xem như xét: i) Điểm thi viết cuối kì môn Toán giải thích có tương quan tuyến tính với số giờ ôn tập của các sinh viên hay không? cùng ii) số giờ ôn tập của những sinh viên có tương quan tuyến tính với điểm thi viết cuối kì môn Toán giải thích hay không?

Các bước tiếp sau đây hướng dẫn chúng ta cách phân tích tương quan Pearson r trong thống kê lại SPSS.

Xem thêm: Nghĩa Của Từ Specify Là Gì Trong Tiếng Việt? Specify Tiếng Anh Là Gì

– bước 1: khám nghiệm biểu thứ phân tán tế bào tả quan hệ giữa nhị biến. Xin vui tươi đọc bài xích cách vẽ biểu đồ gia dụng phân tán. Kết quả vẽ biểu thiết bị phân tán được trình diễn trong hình dưới đây.

*

Nhận xét: Biểu vật scatter thân Điểm thiÔn tập gợi ý xu hướng ngay sát đúng con đường tính, tuy nhiên cỡ mẫu mã là bé dại để quan sát ví dụ một đường tuyến tính. Vào thực tế, bọn họ cần một độ lớn mẫu phệ hơn, tối thiểu n > 30. Biểu trang bị này cũng cho biết thêm một quan ngay cạnh ngoại lệ rất rõ ràng (điểm gần cực hiếm 4 làm việc trục hoành).

– cách 2: khi biểu đồ gia dụng phân tán dự kiến mối quan tiền hệ tuyến đường tính, bọn họ tiến hành phân tích đối sánh Pearson r. Click Analyze-> Correlate -> Bivariate…

*

– cách 3: Trong vỏ hộp thoại Bivariate Correlations, chúng ta chuyển các biến yêu cầu kiểm tra đối sánh với nhau vào hộp Variables. Chú ý check vào vỏ hộp Pearson vào vùng Correlation Coefficients. Kế tiếp nhấp OK để chạy kết quả.

*

Phân tích kết quả:

Bảng Correlations trình bày hệ số đối sánh Pearson r, giá chỉ trị ý nghĩa sâu sắc p của nó và form size mẫu được tính toán. Trong ví dụ như này, bạn có thể thấy rằng hệ số tương quan Pearson, r, là 0.78 và nó có ý nghĩa sâu sắc thống kê (p = 0.000).

*

Chúng ta rất có thể viết báo cáo rằng, một đối sánh Pearson đã có chạy để xác định mối quan lại hệ đường tính giữa Điểm thi viết cuối kì môn Toán phân tích và lý giải và thời gian ôn tập của các sinh viên. Kết quả cho biết có mối tương quan thuận giữa Điểm thi viết cuối kì môn Toán giải thích và số giờ ôn tập của các sinh viên (r = 0.780, n = 20, p = 0.000).

– bước 4: Kiểm tra chân thành và ý nghĩa của hệ số tương quan r

Một lúc mối đối sánh tương quan đã được xem toán, đơn vị nghiên cứu rất có thể muốn biết năng lực xảy ra mối đối sánh thu được này như thế nào, nghĩa là, đây có phải là sự xuất hiện tình cờ hay nó đại diện cho mối đối sánh tương quan dân số xứng đáng kể?

Để triển khai việc này, r được đưa đổi, và xác suất của điều khoản ước lượng này dựa trên phân phối chủng loại của thống kê t (t-statistic). vày đó, ý nghĩa sâu sắc của một hệ số tương quan Pearson nhận được được đánh giá bằng phương pháp sử dụng phân phối t (t-distribution) cùng với n − 2 bậc tự do (df) cùng được cho vì phương trình sau:

*

Giả thuyết vô hiệu được kiểm định là hai phát triển thành độc lập, tức là không có mối quan hệ tuyến tính giữa chúng, H0: ρ = 0. Giả thuyết thay thế sửa chữa là, H1: ρ ≠ 0.

Để trả lời câu hỏi, gồm mối đối sánh đáng đề cập nào, ở tại mức 5%, giữa điểm Điểm thi viết cuối kì môn Toán phân tích và lý giải và thời gian ôn tập của những sinh viên không? t sẽ tiến hành tính như sau:

*

Tra bảng cho tới hạn của quý giá t (critical t-value) thu được giá trị là 2.101. Thống kê soát sổ t là vượt quá quý giá tới hạn này, (5.433 > 2.101), và vì thế giả thuyết vô hiệu bị bác bỏ. Bọn họ kết luận rằng mối đối sánh có ý nghĩa sâu sắc ở nấc 5%.

– bước 5: khám nghiệm khoảng tin cẩn của hệ số đối sánh tương quan r

Khoảng tin cậy là nhờ vào một sự thay đổi thống kê r thành thống kê lại Fisher’s z. Điều này không hệt như độ lệch Z (Z-deviate) so với phân phối chuẩn chỉnh (đôi lúc được gọi là điểm Z). Để diễn giải khoảng chừng tin cậy, điểm số Fisher’s z nên được biến hóa trở lại số liệu tương quan. Fisher’s z được reviews là:

Khoảng tin cậy (95%) mang lại mối đối sánh tương quan lưỡng đổi thay giữa Điểm thi viết cuối kì môn Toán giải thích và số giờ ôn tập của các sinh viên được tính bằng công thức:

*

Công thức biến hóa Fisher’s Z được tư tưởng là:

*

Áp dụng những công thức trong lấy một ví dụ (với r = 0.78), ta có:

*

Khoảng tin cẩn (95%):

*

= 0.57 đến 1.52

Các quý hiếm này hiện thời phải được thay đổi trở lại số liệu ban đầu.

Xem thêm: Tinh Dầu Xô Thơm Clary Sage Là Gì ? Có Tác Dụng Gì Trong Mỹ Phẩm?

*

Nhận xét: bạn có thể kết luận rằng bọn họ chắc chắn 95% rằng mối tương quan dân số là dương cùng nằm trong khoảng 0.515 mang đến 0.909. Khoảng tin yêu này không bao hàm giá trị 0, điều này cho biết thêm mối đối sánh có ý nghĩa sâu sắc thống kê ở mức 5%.

Tài liệu tham khảo