Thứ Tư, 2 tháng 8, 2023

Berkson’s paradox

 

Berkson’s paradox (còn được biết đến với tên gọi Berkson’s fallacy hay Berkson’s bias)  được đặt theo tên của các nhà thống kê đầu tiên mô tả nghịch lý, Joseph Berkson và John Jekel. Nghịch lý Berkson-Jekel được phát hiện ra khi hai nhà thống kê đang nghiên cứu mối tương quan giữa hút thuốc và ung thư phổi. Trong quá trình nghiên cứu, họ đã tìm thấy mối tương quan giữa những người nhập viện vì viêm phổi và ung thư phổi so với dân số nói chung. Tuy nhiên, họ đã tiến hành nghiên cứu sâu hơn cho thấy mối tương quan là tìm ra những thực tế không giống như ngộ nhận về mối liên hệ giữa hai căn bệnh. 

Berkson đã viết về nghịch lý này vào năm 1946. Bài báo gốc của ông chỉ ra rằng hai căn bệnh không có mối quan hệ thực sự nào lại có thể là cái mà ông gọi là 'liên quan giả tạo - spuriously associated' trong các nghiên cứu kiểm soát ca bệnh tại bệnh viện. Tuy nhiên, ý tưởng này không được chấp nhận rộng rãi cho đến năm 1979, khi David Sackett của Đại học McMaster đưa ra bằng chứng mạnh mẽ rằng nghịch lý Berkson thực sự tồn tại.

 

Nghịch lý Berkson-Jekel cũng có thể được xem  là xảy ra khi hai biến tương quan với nhau trong dữ liệu, tuy nhiên, khi dữ liệu được nhóm lại hoặc tập hợp con, mối tương quan không còn xác định được nữa. Nghĩa là, mối tương quan giữa các sự kiện khác nhau trong các nhóm dữ liệu con khác nhau.

 

 


(Nguồn: https://www.fantasylabs.com/articles/labyrinthian-berksons-paradox-and-daily-fantasy-sports/)

 

 

Một số ví dụ của Nghịch lý Berkson-Jekel

·      Trong một nghiên cứu tại bệnh viện xác định xem ung thư tuyến tụy và việc sử dụng cà phê có tương quan với nhau hay không, nhóm đối chứng được lấy từ các bệnh nhân của bác sĩ chuyên khoa tiêu hóa. Tuy nhiên, những bệnh nhân bị rối loạn tiêu hóa ít có khả năng uống cà phê hơn so với dân số nói chung vì họ bị rối loạn tiêu hóa. Vì vậy, nghiên cứu đã thổi phồng tỷ lệ uống cà phê một cách giả tạo trong nhóm thử nghiệm trái ngược với nhóm kiểm soát giảm bớt.

·      Nhiều cá nhân sẽ chỉ hẹn hò với những đối tác vừa hấp dẫn vừa có tính cách tốt. Tuy nhiên, có một nhận xét phổ biến (mặc dù không có căn cứ) rằng những người đàn ông đẹp trai thường là những kẻ lừa tình; hoặc những cô gái tóc vàng thường ngốc nghếch.

·      Có những nhận định cho rằng xếp hạng chất lượng cho những cuốn sách đã giành được giải thưởng văn học đã giảm xuống sau khi cuốn sách giành được giải thưởng.

·      Giả sử một trường đại học chỉ nhận những sinh viên có điểm trung bình đủ cao và điểm ACT đủ cao. Mọi người đều biết rằng hai biến số này có mối tương quan thuận, nhưng hóa ra trong số những sinh viên quyết định theo học một trường đại học cụ thể nào đó, dường như có mối tương quan nghịch giữa hai yếu tố này.

 

Tài liệu tham khảo:

https://brilliant.org/wiki/berksons-paradox/

https://www.fantasylabs.com/articles/labyrinthian-berksons-paradox-and-daily-fantasy-sports/

https://www.kdnuggets.com/2023/03/berksonjekel-paradox-importance-data-science.html#:~:text=Berkson%2DJekel%20paradox%20is%20when,different%20subgroups%20of%20the%20data.

Không có nhận xét nào:

Đăng nhận xét

Sandbox

Thuật ngữ "sandbox" trong bối cảnh công nghệ được dùng để chỉ một môi trường thử nghiệm an toàn, trong đó các phần mềm, chương tr...