Thứ Ba, 1 tháng 8, 2023

100 prisoners problem

 Bài toán 100 tù nhân - 100 prisoners problem này lần đầu tiên được công bố vào năm 2003 bởi nhà khoa học máy tính người Đan Mạch Peter Bro Miltersen. Bài toán 100 tù nhân có nhiều phiên bản khác nhau trong tài liệu toán học, nhưng nguyên tắc luôn giống nhau. Đây là một trong số các phiên bản của bài toán:

 

Cai ngục của một nhà tù cho 100 tử tù, được đánh số từ 1 đến 100, một cơ hội cuối cùng. Một căn phòng chứa một cái tủ với 100 ngăn kéo. Giám đốc đặt ngẫu nhiên số của một tù nhân trong mỗi ngăn kéo đã đóng. Các tù nhân lần lượt vào phòng. Mỗi tù nhân có thể mở và xem xét 50 ngăn kéo theo thứ tự bất kỳ. Các ngăn kéo được đóng lại sau đó. Nếu, trong quá trình tìm kiếm này, mọi tù nhân tìm thấy số của mình trong một trong các ngăn kéo, tất cả các tù nhân đều ân xá. Chỉ cần một tù nhân không tìm thấy số của mình, tất cả tù nhân sẽ chết. Trước khi tù nhân đầu tiên bước vào phòng, các tù nhân có thể thảo luận về chiến lược nhưng không được giao tiếp khi tù nhân đầu tiên bước vào để tìm trong các ngăn kéo.

 Chiến lược tốt nhất của tù nhân là gì?


(Nguồn: https://en.wikipedia.org/wiki/100_prisoners_problem)

  

Bản gốc bằng tiếng Anh

 

The director of a prison offers 100 death row prisoners, who are numbered from 1 to 100, a last chance. A room contains a cupboard with 100 drawers. The director randomly puts one prisoner’s number in each closed drawer. The prisoners enter the room, one after another. Each prisoner may open and look into 50 drawers in any order. The drawers are closed again afterwards. If, during this search, every prisoner finds his number in one of the drawers, all prisoners are pardoned. If just one prisoner does not find his number, all prisoners die. Before the first prisoner enters the room, the prisoners may discuss strategy—but may not communicate once the first prisoner enters to look in the drawers.

 What is the prisoners’ best strategy?

 

Lời giải cho bài toán

Nếu mỗi tù nhân chọn ngẫu nhiên 50 ngăn kéo, thì mỗi tù nhân sẽ có xác suất 0,5 để tìm số của chính họ và tất cả các tù nhân sẽ có xác suất kết hợp (1/2)^100 để được ân xá. Tuy nhiên, tồn tại một chiến lược mang lại cho các tù nhân xác suất thành công của hơn 30%. Chìa khóa của chiến lược đó là mỗi tù nhân có thể sử dụng thông tin từ các ngăn kéo trước đó để chọn mở ngăn kéo tiếp theo. Mấu chốt của chiến lược này là xác suất thành công của mỗi tù nhân là không không còn độc lập với xác suất thành công của các tù nhân khác.


Bạn có thấy bóng dáng của suy diễn Bayes trong bài toán này không 😊

 

Tài liệu tham khảo:

[1].              http://datagenetics.com/blog/december42014/index.html

[2].              https://math.mit.edu/~apost/courses/18.204_2018/Timothee_Schoen_paper.pdf

[3].              https://www.r-bloggers.com/2010/07/100-prisoners-100-lines-of-code/

 

Không có nhận xét nào:

Đăng nhận xét

Fraud Triangle

 Tam giác gian lận, tiếng Anh là fraud triangle , là một mô hình lý thuyết được sử dụng để giải thích hành vi gian lận trong các tổ chức. Mô...