- Trong khoa học xã hội và khoa học sự sống, gần như mọi biến số đều có một mức độ tương quan nhất định với nhau
- Hiện tượng này không phải chỉ là ngẫu nhiên đơn thuần hay lỗi thống kê, mà là một thực tế bắt nguồn từ các yếu tố di truyền và môi trường đan xen phức tạp
- Khi cỡ mẫu tăng lên, các tương quan có ý nghĩa thống kê xuất hiện ở hầu hết mọi cặp biến, và nhà nghiên cứu bắt đầu chú ý đến chính mẫu hình tương quan thay vì từng tương quan riêng lẻ
- ‘Crud factor’ nghĩa là gần như mọi cặp biến đều tồn tại một tương quan nhỏ, và chỉ với việc chọn ngẫu nhiên một lý thuyết cùng cặp biến, cũng có xác suất cao thu được kết quả có ý nghĩa
- Trong tình huống như vậy, ý nghĩa của ngưỡng ý nghĩa truyền thống (0.05) bị suy yếu, đòi hỏi phải thận trọng khi diễn giải thống kê trong khoa học xã hội
Tổng quan và bối cảnh
- Trong tâm lý học và xã hội học, nhận định “mọi thứ ở một mức độ nào đó đều có tương quan với nhau” được chấp nhận rộng rãi
- Một đặc tính cụ thể được quyết định bởi nhiều yếu tố di truyền và môi trường, và giữa các yếu tố này cũng tự thân tồn tại tương quan
- Vì vậy, trên thực tế gần như mọi biến có thể đo lường đều có một mức độ liên hệ lẫn nhau nào đó
“Crud Factor” và các phát hiện thống kê
- “Crud factor” là hiện tượng, trong nghiên cứu khoa học xã hội (và một phần khoa học sự sống), luôn tồn tại một tương quan nhỏ ngay cả giữa các cặp biến được chọn ngẫu nhiên
- Trong bộ dữ liệu quy mô lớn khảo sát 57.000 học sinh trung học Minnesota năm 1966, kết quả phân tích 105 bảng chéo (crosstabulation) giữa các biến đa dạng như gia đình, giáo dục, hoạt động sở thích, định hướng nghề nghiệp, tôn giáo... đều có ý nghĩa thống kê
- 96% trong toàn bộ số này loại trừ khả năng chỉ là ngẫu nhiên với mức xác suất cực thấp p<10⁻⁶
- Khi mở rộng số biến lên 45, thì trong tổng số 990 tổ hợp, có 92% đạt ý nghĩa thống kê
- Trung vị (median) về số quan hệ có ý nghĩa giữa một biến và tất cả các biến còn lại là 41 trên 44
Các ví dụ giữa những biến thực tế
- Với mối quan hệ giữa điểm MCAT và số anh chị em, thứ tự sinh, giới tính, kế hoạch nghề nghiệp, sở thích tôn giáo..., tất cả đều phát hiện ý nghĩa thống kê cao
- Ví dụ: nữ sinh có điểm cao hơn nam, số anh chị em càng nhiều thì điểm có xu hướng giảm, con đầu/là con một thông minh hơn con út, có nhiều khác biệt rõ rệt giữa các nhóm tôn giáo, v.v.
- Ngay cả giữa 5 hệ phái Tin Lành tiêu biểu, mức ý nghĩa cao cũng được quan sát trong quan hệ với nhiều biến khác nhau
- Ví dụ: xác suất con một theo Presbyterian gần gấp đôi Baptist, sự khác biệt theo hệ phái về mức yêu thích trường học và nguyện vọng nghề nghiệp, cùng nhiều tương quan khác
Trường hợp các câu hỏi MMPI
- Trong 550 mục của MMPI (trắc nghiệm nhân cách), có 507 mục (92%) cho thấy khác biệt có ý nghĩa theo giới tính
- Một số câu hỏi có thể giải thích rõ ràng sự khác biệt về xu hướng, nhưng các mục khác thì nguyên nhân lại phức tạp hoặc không thể giải thích
- Vì các kết quả này xuất hiện trong nghiên cứu quy mô lớn với cỡ mẫu rất lớn, nên đây không phải lỗi thống kê (type I error) mà là hiện tượng thực chất
Tương quan trong khoa học xã hội và giới hạn của việc kiểm chứng lý thuyết
- Ngay cả khi kết hợp ngẫu nhiên một lý thuyết và một cặp biến, nếu tương quan trung bình (crud factor) ở mức 0.30, thì trên thực tế có thể phát hiện khác biệt có ý nghĩa khoảng một lần trong ba lần
- Hiện tượng này xảy ra thường xuyên hơn rất nhiều so với ngưỡng ý nghĩa (0.05) vốn thường được xem là có ý nghĩa trong khoa học xã hội
- Vì tương quan cũng dễ dàng lộ ra ở cả những cặp biến mà nhà nghiên cứu không dự đoán về mặt lý thuyết, nên chỉ riêng ý nghĩa thống kê rất khó dùng để hậu thuẫn cho quan hệ nhân quả thực chất
- Các nguyên nhân phức hợp (di truyền/môi trường) cùng sự phong phú của dữ liệu quan sát tạo ra những tương quan đa chiều như vậy
Kết luận thực tiễn
- Khi diễn giải dữ liệu khoa học xã hội và kiểm chứng lý thuyết, cần luôn ghi nhớ “những tương quan bình thường nhưng có thật” do ‘crud factor’ tạo ra
- Thay vì tuyệt đối tin vào thống kê ngưỡng ý nghĩa (ví dụ: p<0.05), cần có cách tiếp cận tập trung hơn vào tính nhân quả thực chất giữa các biến và việc diễn giải mẫu hình
- Như câu nói nổi tiếng của Thorndike, “mọi điều tốt đẹp đều có xu hướng đi cùng nhau”, trong thế giới thực quá nhiều thứ đang đan xen với nhau
Chưa có bình luận nào.