“A computer would deserve to be called intelligent if it could deceive a human into believing that it was human,”
Alan Turing
1.
Turing
test là gì?
Phép thử
Turing là một phương pháp để xác định xem máy tính có khả năng suy nghĩ như con
người hay không. Phép thử được đặt theo tên của Alan Turing, người sáng lập ài
kiểm tra Turing và là một nhà khoa học máy tính, nhà phân tích mật mã, nhà toán
học và nhà sinh học lý thuyết người Anh. Nếu một cỗ máy có thể tham gia vào cuộc trò
chuyện với con người mà không bị phát hiện là một cỗ máy, thì nó đã chứng tỏ
trí thông minh của con người.
Thử nghiệm
Turing được đề xuất trong một bài báo xuất bản năm 1950 bởi nhà toán học và nhà
tiên phong về máy tính Alan Turing. Nó đã trở thành động lực cơ bản trong lý
thuyết và sự phát triển của Trí tuệ nhân tạo (AI). Turing đề xuất rằng một máy
tính có thể được coi là có khả năng suy nghĩ như con người nếu nó có thể bắt
chước phản ứng của con người trong những điều kiện cụ thể. Thử nghiệm Turing
ban đầu yêu cầu ba thiết bị đầu cuối, mỗi thiết bị đầu cuối được tách biệt về mặt
vật lý với hai thiết bị đầu cuối còn lại. Một thiết bị đầu cuối được vận hành bởi
máy tính, trong khi hai thiết bị còn lại do con người vận hành.
Trong
quá trình thử nghiệm, một trong những người đóng vai trò là người đặt câu hỏi,
trong khi người thứ hai và máy tính đóng vai trò là người trả lời. Người hỏi thẩm
vấn người trả lời trong một lĩnh vực chủ đề cụ thể, sử dụng một định dạng và ngữ
cảnh cụ thể. Sau một khoảng thời gian hoặc số lượng câu hỏi định sẵn, người hỏi
sau đó được yêu cầu quyết định xem người trả lời nào là người và đâu là máy
tính.
Thử nghiệm được lặp lại nhiều lần. Nếu người hỏi đưa ra quyết định chính xác trong một nửa số lần chạy thử nghiệm hoặc ít hơn, thì máy tính được coi là có ‘trí tuệ nhân tạo” vì người hỏi coi nó "giống như con người".
(Nguồn hình: https://www.socialaites.org/blog/the-turing-test)
2.
Lịch
sử của Turing test
Alan
Turing đã phát triển một số khái niệm cơ bản về khoa học máy tính trong khi tìm
kiếm một phương pháp hiệu quả hơn để giải mã các thông điệp được mã hóa của Đức
trong Thế chiến II. Sau chiến tranh, ông bắt đầu nghĩ về trí tuệ nhân tạo. Trong bài báo năm 1950 của mình, Turing bắt đầu
bằng cách đặt ra câu hỏi, "Máy móc có thể suy nghĩ không?" Sau đó,
ông đề xuất một bài kiểm tra nhằm giúp con người trả lời câu hỏi.
Một số
máy tính đời đầu tuyên bố sớm có khả năng đánh lừa con người trong những tình
huống rất cơ bản. Năm 1966, Joseph Weizenbaum đã tạo ra ELIZAcó thể tổng hợp các
từ để diễn đạt thành câu cụ thể. ELIZA là một trong những máy tính đầu tiên
đánh lừa người thử nghiệm nghĩ rằng đó là con người.
Chưa đầy
một thập kỷ sau, một chatbot có tên PARRY đã được lập mô hình để bắt chước hành
vi của một bệnh nhân tâm thần phân liệt hoang tưởng. Một nhóm bác sĩ tâm thần
được yêu cầu phân tích các cuộc trò chuyện với bệnh nhân thật và cuộc trò chuyện
với PARRY. Khi được yêu cầu xác định bảng điểm nào là chương trình máy tính,
nhóm chỉ có thể xác định máy trong 48% các lần thử nghiệm.
Những người chỉ trích cả ELIZA và PARRY tuyên
bố rằng toàn bộ quy tắc của bài kiểm tra Turing đã không được đáp ứng và không
chỉ ra trí thông minh đầy đủ của máy. Một chatbot có tên Eugene Goostman được một
số người chấp nhận là người đầu tiên vượt qua Bài kiểm tra Turing vào năm 2014.
Phép thử
Turing vẫn vấp phải nhiều lời chỉ trích, nhưng nó vẫn là một trong những thước
đo được sử dụng để đo mức độ thành công của các dự án trí tuệ nhân tạo. Một
phiên bản cập nhật của Bài kiểm tra Turing có nhiều hơn một giám khảo là con
người thẩm vấn và trò chuyện với cả hai đối tượng. Dự án được coi là thành công
nếu hơn 30% giám khảo, sau năm phút trò chuyện, kết luận rằng máy tính là con
người.
Giải thưởng
Loebner là một cuộc thi Thử nghiệm Turing hàng năm được phát động vào năm 1991
bởi Hugh Loebner, một nhà phát minh và nhà hoạt động người Mỹ. Loebner đã tạo
ra các quy tắc bổ sung yêu cầu con người và chương trình máy tính phải có cuộc
trò chuyện kéo dài 25 phút với mỗi người trong số bốn giám khảo. Người chiến thắng là máy tính có chương trình
nhận được nhiều phiếu bầu nhất và thứ hạng cao nhất từ ban giám khảo.
Vào năm
2014, Kevin Warwick của Đại học Reading đã tổ chức một cuộc thi Thử nghiệm
Turing để kỷ niệm 60 năm ngày mất của Alan Turing. Một chatbot máy tính có tên
là Eugene Goostman, người có tính cách của một cậu bé 13 tuổi, đã vượt qua Bài
kiểm tra Turing một cách kỹ thuật trong sự kiện đó. Anh ấy đã giành được phiếu
bầu của 33% giám khảo, những người tin rằng anh ấy là con người.
Năm
2018, Google Duplex tiết lộ khả năng thực hiện các tác vụ qua điện thoại. Trong
nhiều cuộc biểu tình khác nhau, Duplex lên lịch hẹn làm tóc cũng như gọi điện đến
một nhà hàng mà con người ở đầu dây bên kia không nhận ra rằng họ đang tương
tác với một chiếc máy. Tuy nhiên, các
nhà phê bình chỉ ra rằng sự tương tác không phù hợp với bài kiểm tra Turing thực
tế và cho rằng bài kiểm tra vẫn chưa bị máy đánh bại.
3.
Các biến
thể của phép thử Turing
Kể từ
khi phép thử Turing được tạo ra, các phương pháp tiếp cận hiện đại hơn đã phát
triển nhằm nỗ lực phát hiện con người và máy móc tốt hơn. Các biến thể này liên
tục phát triển cùng với quá trình tiến bộ công nghệ.
·
Phép thử Turing (The Reverse Turing Test)
ngược nhằm mục đích để con người đánh lừa máy tính khiến máy tính tin rằng nó
không thẩm vấn con người.
·
Bài kiểm tra Turing tổng thể (The Total
Turing Test) kết hợp khả năng nhận thức và khả năng kiểm soát sự việc của
người được hỏi.
·
Thử nghiệm Marcus (The Marcus Test) yêu cầu
các đối tượng thử nghiệm xem các bản tin hoặc thông tin truyền thông và trả lời
các câu hỏi về nội dung liên quan đến thông tin đã xem.
·
Bài kiểm tra Lovelace 2.0 (The Lovelace Test 2.0
) có thực hiện các bài kiểm tra liên quan đến nghệ thuật.
· Phép thử Tín hiệu thông minh giản tiện (The Minimum Intelligent Signal test) sử dụng câu hỏi Yes/No trong các bài kiểm tra.
(Nguồn
hình: https://tvtropes.org/pmwiki/pmwiki.php/Main/TuringTest)
4.
Những
hạn chế của phép thử Turing
Phép thử
Turing được ghi nhận có nhiều hạn chế và các biến thể của nó đã cố gắng giảm
thiểu những hạn chế này. Tuy nhiên, vẫn còn những điểm yếu cần được khắc phục.
Một là, phép thử Turing yêu cầu thực hiện
trong một môi trường được kiểm soát chặt chẽ. Những người tham gia bài kiểm tra
phải được ẩn khỏi tầm nhìn của nhau trong toàn bộ quá trình thử nghiệm.
Hai là,
bài kiểm tra
Turing có thể có không phù hợp cho mọi tình huống kiểm tra trí thông minh của máy
móc các hệ thống máy tính khác nhau được cấu trúc khác nhau. Do đó, sử dụng cùng
một cách thức kiểm tra cho tất cả các định dạng hệ thống đôi khi không có được
câu trả lời xác đáng.
Ba là, những phép thử Turing thế hệ mới vẫn
đang được cập nhật và phát triển; tuy nhiên, những tiến bộ công nghệ đang phát
triển quá nhanh. Khi máy tính có với sức mạnh công nghệ lớn hơn, các phương
pháp thử nghiệm truyền thống có thể không còn phù hợp nữa.
Tài liệu tham khảo
[1].
https://www.techtarget.com/searchenterpriseai/definition/Turing-test
[2].
https://www.investopedia.com/terms/t/turing-test.asp
[3].
https://www.geeksforgeeks.org/turing-test-artificial-intelligence/
[4].
https://www.javatpoint.com/turing-test-in-ai
[5].
https://www.theguardian.com/technology/2014/jun/09/what-is-the-alan-turing-test
Không có nhận xét nào:
Đăng nhận xét