Mỗi ngày một điều mới cùng Tr Anh: Turing test

“A computer would deserve to be called intelligent if it could deceive a human into believing that it was human,”

Alan Turing

1. Turing test là gì?

Phép thử Turing là một phương pháp để xác định xem máy tính có khả năng suy nghĩ như con người hay không. Phép thử được đặt theo tên của Alan Turing, người sáng lập ài kiểm tra Turing và là một nhà khoa học máy tính, nhà phân tích mật mã, nhà toán học và nhà sinh học lý thuyết người Anh. Nếu một cỗ máy có thể tham gia vào cuộc trò chuyện với con người mà không bị phát hiện là một cỗ máy, thì nó đã chứng tỏ trí thông minh của con người.

Thử nghiệm Turing được đề xuất trong một bài báo xuất bản năm 1950 bởi nhà toán học và nhà tiên phong về máy tính Alan Turing. Nó đã trở thành động lực cơ bản trong lý thuyết và sự phát triển của Trí tuệ nhân tạo (AI). Turing đề xuất rằng một máy tính có thể được coi là có khả năng suy nghĩ như con người nếu nó có thể bắt chước phản ứng của con người trong những điều kiện cụ thể. Thử nghiệm Turing ban đầu yêu cầu ba thiết bị đầu cuối, mỗi thiết bị đầu cuối được tách biệt về mặt vật lý với hai thiết bị đầu cuối còn lại. Một thiết bị đầu cuối được vận hành bởi máy tính, trong khi hai thiết bị còn lại do con người vận hành.

Trong quá trình thử nghiệm, một trong những người đóng vai trò là người đặt câu hỏi, trong khi người thứ hai và máy tính đóng vai trò là người trả lời. Người hỏi thẩm vấn người trả lời trong một lĩnh vực chủ đề cụ thể, sử dụng một định dạng và ngữ cảnh cụ thể. Sau một khoảng thời gian hoặc số lượng câu hỏi định sẵn, người hỏi sau đó được yêu cầu quyết định xem người trả lời nào là người và đâu là máy tính.

Thử nghiệm được lặp lại nhiều lần. Nếu người hỏi đưa ra quyết định chính xác trong một nửa số lần chạy thử nghiệm hoặc ít hơn, thì máy tính được coi là có ‘trí tuệ nhân tạo” vì người hỏi coi nó "giống như con người".

(Nguồn hình: https://www.socialaites.org/blog/the-turing-test)

2. Lịch sử của Turing test

Alan Turing đã phát triển một số khái niệm cơ bản về khoa học máy tính trong khi tìm kiếm một phương pháp hiệu quả hơn để giải mã các thông điệp được mã hóa của Đức trong Thế chiến II. Sau chiến tranh, ông bắt đầu nghĩ về trí tuệ nhân tạo. Trong bài báo năm 1950 của mình, Turing bắt đầu bằng cách đặt ra câu hỏi, "Máy móc có thể suy nghĩ không?" Sau đó, ông đề xuất một bài kiểm tra nhằm giúp con người trả lời câu hỏi.

Một số máy tính đời đầu tuyên bố sớm có khả năng đánh lừa con người trong những tình huống rất cơ bản. Năm 1966, Joseph Weizenbaum đã tạo ra ELIZAcó thể tổng hợp các từ để diễn đạt thành câu cụ thể. ELIZA là một trong những máy tính đầu tiên đánh lừa người thử nghiệm nghĩ rằng đó là con người.

Chưa đầy một thập kỷ sau, một chatbot có tên PARRY đã được lập mô hình để bắt chước hành vi của một bệnh nhân tâm thần phân liệt hoang tưởng. Một nhóm bác sĩ tâm thần được yêu cầu phân tích các cuộc trò chuyện với bệnh nhân thật và cuộc trò chuyện với PARRY. Khi được yêu cầu xác định bảng điểm nào là chương trình máy tính, nhóm chỉ có thể xác định máy trong 48% các lần thử nghiệm.

Những người chỉ trích cả ELIZA và PARRY tuyên bố rằng toàn bộ quy tắc của bài kiểm tra Turing đã không được đáp ứng và không chỉ ra trí thông minh đầy đủ của máy. Một chatbot có tên Eugene Goostman được một số người chấp nhận là người đầu tiên vượt qua Bài kiểm tra Turing vào năm 2014.

Phép thử Turing vẫn vấp phải nhiều lời chỉ trích, nhưng nó vẫn là một trong những thước đo được sử dụng để đo mức độ thành công của các dự án trí tuệ nhân tạo. Một phiên bản cập nhật của Bài kiểm tra Turing có nhiều hơn một giám khảo là con người thẩm vấn và trò chuyện với cả hai đối tượng. Dự án được coi là thành công nếu hơn 30% giám khảo, sau năm phút trò chuyện, kết luận rằng máy tính là con người.

Giải thưởng Loebner là một cuộc thi Thử nghiệm Turing hàng năm được phát động vào năm 1991 bởi Hugh Loebner, một nhà phát minh và nhà hoạt động người Mỹ. Loebner đã tạo ra các quy tắc bổ sung yêu cầu con người và chương trình máy tính phải có cuộc trò chuyện kéo dài 25 phút với mỗi người trong số bốn giám khảo. Người chiến thắng là máy tính có chương trình nhận được nhiều phiếu bầu nhất và thứ hạng cao nhất từ ban giám khảo.

Vào năm 2014, Kevin Warwick của Đại học Reading đã tổ chức một cuộc thi Thử nghiệm Turing để kỷ niệm 60 năm ngày mất của Alan Turing. Một chatbot máy tính có tên là Eugene Goostman, người có tính cách của một cậu bé 13 tuổi, đã vượt qua Bài kiểm tra Turing một cách kỹ thuật trong sự kiện đó. Anh ấy đã giành được phiếu bầu của 33% giám khảo, những người tin rằng anh ấy là con người.

Năm 2018, Google Duplex tiết lộ khả năng thực hiện các tác vụ qua điện thoại. Trong nhiều cuộc biểu tình khác nhau, Duplex lên lịch hẹn làm tóc cũng như gọi điện đến một nhà hàng mà con người ở đầu dây bên kia không nhận ra rằng họ đang tương tác với một chiếc máy. Tuy nhiên, các nhà phê bình chỉ ra rằng sự tương tác không phù hợp với bài kiểm tra Turing thực tế và cho rằng bài kiểm tra vẫn chưa bị máy đánh bại.

3. Các biến thể của phép thử Turing

Kể từ khi phép thử Turing được tạo ra, các phương pháp tiếp cận hiện đại hơn đã phát triển nhằm nỗ lực phát hiện con người và máy móc tốt hơn. Các biến thể này liên tục phát triển cùng với quá trình tiến bộ công nghệ.

· Phép thử Turing (The Reverse Turing Test) ngược nhằm mục đích để con người đánh lừa máy tính khiến máy tính tin rằng nó không thẩm vấn con người.

· Bài kiểm tra Turing tổng thể (The Total Turing Test) kết hợp khả năng nhận thức và khả năng kiểm soát sự việc của người được hỏi.

· Thử nghiệm Marcus (The Marcus Test) yêu cầu các đối tượng thử nghiệm xem các bản tin hoặc thông tin truyền thông và trả lời các câu hỏi về nội dung liên quan đến thông tin đã xem.

· Bài kiểm tra Lovelace 2.0 (The Lovelace Test 2.0 ) có thực hiện các bài kiểm tra liên quan đến nghệ thuật.

· Phép thử Tín hiệu thông minh giản tiện (The Minimum Intelligent Signal test) sử dụng câu hỏi Yes/No trong các bài kiểm tra.

(Nguồn hình: https://tvtropes.org/pmwiki/pmwiki.php/Main/TuringTest)

4. Những hạn chế của phép thử Turing

Phép thử Turing được ghi nhận có nhiều hạn chế và các biến thể của nó đã cố gắng giảm thiểu những hạn chế này. Tuy nhiên, vẫn còn những điểm yếu cần được khắc phục.

Một là, phép thử Turing yêu cầu thực hiện trong một môi trường được kiểm soát chặt chẽ. Những người tham gia bài kiểm tra phải được ẩn khỏi tầm nhìn của nhau trong toàn bộ quá trình thử nghiệm.

Hai là, bài kiểm tra Turing có thể có không phù hợp cho mọi tình huống kiểm tra trí thông minh của máy móc các hệ thống máy tính khác nhau được cấu trúc khác nhau. Do đó, sử dụng cùng một cách thức kiểm tra cho tất cả các định dạng hệ thống đôi khi không có được câu trả lời xác đáng.

Ba là, những phép thử Turing thế hệ mới vẫn đang được cập nhật và phát triển; tuy nhiên, những tiến bộ công nghệ đang phát triển quá nhanh. Khi máy tính có với sức mạnh công nghệ lớn hơn, các phương pháp thử nghiệm truyền thống có thể không còn phù hợp nữa.

Tài liệu tham khảo

[1]. https://www.techtarget.com/searchenterpriseai/definition/Turing-test

[2]. https://www.investopedia.com/terms/t/turing-test.asp

[3]. https://www.geeksforgeeks.org/turing-test-artificial-intelligence/

[4]. https://www.javatpoint.com/turing-test-in-ai

[5]. https://www.theguardian.com/technology/2014/jun/09/what-is-the-alan-turing-test