Bước tiến mới trong AI

Lần đầu một chương trình trí tuệ nhân tạo (AI) đã đánh bại các tay chơi chuyên nghiệp trong một ván bài poker Texas hold’em, gồm sáu người tham gia. Sự kiện này đánh dấu một bước tiến lớn trong phát triển các chương trình AI tham gia các cuộc tranh tài gồm nhiều bên.

GS Sandholm theo dõi ván đấu giữa AI và năm tay chơi poker chuyên nghiệp. Ảnh: TECHXPLORE
GS Sandholm theo dõi ván đấu giữa AI và năm tay chơi poker chuyên nghiệp. Ảnh: TECHXPLORE

Nghiên cứu đăng tải trên tạp chí Science cho thấy, chương trình AI có tên gọi Pluribus, do Đại học Carnegie Mellon phối hợp Facebook AI phát triển, đã chơi bài cùng với năm tay chơi chuyên nghiệp khác trong một khoảng thời gian với tổng số 10.000 ván. Nghiên cứu nêu rõ, năm người chơi cùng Pluribus đều là những tay chơi poker hàng đầu thế giới, từng thắng hơn một triệu USD giải thưởng trở lên tại các giải đấu chuyên nghiệp. Tuy nhiên, Pluribus đã giành chiến thắng với những con số thống kê đáng nể.

GS Tuomas Sandholm, chuyên gia ngành khoa học máy tính tại Đại học Carnegie Mellon (Mỹ), người đứng đầu nghiên cứu nói trên, cho rằng việc Pluribus có thể đánh bại năm tay chơi còn lại trong một cuộc đấu sáu bên đã mở ra những hy vọng mới trong việc sử dụng AI để giải quyết hàng loạt các vấn đề thực tiễn, vốn cần tới nhiều chương trình máy tính khác nhau mới có thể giải quyết. Tới nay, công nghệ AI mới chỉ tạo được thành tích trong các nội dung đấu gồm hai bên tham gia, như chơi cờ vua hay chơi bài Go.Poker.

Chương trình AI sử dụng trong các trò chơi hai người gần giống lý thuyết cân bằng Nash, theo đó bảo đảm kết quả tối thiểu là hòa. AI sẽ giành chiến thắng một khi đối thủ mắc sai lầm và đánh mất thế cân bằng. Tuy nhiên, trong trò chơi nhiều người, ứng dụng Nash tỏ ra không hiệu quả, vì vậy Pluribus được phát triển để liên tục chơi cao tay hơn các đối thủ. Pluribus cũng được dạy để chơi một cách khó đoán, bằng cách không phải lúc nào cũng lựa chọn cách ra bài tốt nhất. Với những gì đã được lập trình và huấn luyện, Pluribus đã tìm ra chiến thuật để chiến thắng các tay chơi hàng đầu thế giới chỉ trong tám ngày.

Nhóm nghiên cứu cho biết, chiến thắng của Pluribus là một bước ngoặt lớn chứng minh rằng AI có thể được ứng dụng để giải quyết rất nhiều vấn đề thực tiễn phức tạp ảnh hưởng tới nhiều bên tham gia và trong điều kiện không có đầy đủ thông tin.