OpenAI Đánh Bại DeepMind Trong Trò Atari Với Thuật Toán Từ Những Năm 80

10 Tháng Tư 20179:00 CH(Xem: 13067)

Lịch sử nghiên cứu trí thông minh nhân tạo (AI) đã chứng kiến rất nhiều trường hợp thành công với những ý tưởng cũ kỹ, tưởng chừng đã lỗi thời. Đến tháng 04/2017, các nhà nghiên cứu thuộc dự án AI của Elon Musk đã khởi động lại “NeuroEvolution”, một lĩnh vực được tiến hành từ những năm 1980, và đạt được kết quả đáng mừng.

Theo đó, Ilya Sutskever, giám đốc công ty nghiên cứu trí tuệ nhân tạo phi lợi nhuận OpenAI dẫn đầu nhóm nghiên cứu, đã khám phá ra việc sử dụng tập hợp thuật toán trong lĩnh vực, gọi là “evolution strategies” nhằm mục đích giải quyết các vấn đề tối ưu. Cách tiếp cận không liên quan tới tiến hóa sinh học.

Về cơ bản, nó dựa vào việc cho phép các cá thể thành công vượt qua chính những đặc điểm của chúng cho thế hệ tương lai. Nhóm nghiên cứu đã dùng những thuật toán được chỉnh sửa lại để có thể làm việc tốt hơn với mạng lưới thần kinh học sâu và chạy trên các hệ thống máy tính phân phối lớn. Để xác định tính hiệu quả, nhóm nghiên cứu đã thiết lập nhiệm vụ cho chúng với loạt thách thức có điểm chuẩn rõ ràng được coi như tiêu chí tăng cường khả năng học tập, kỹ thuật vốn đặt nền tảng cho những thành công ấn tượng của Google DeepMind, bao gồm cả chiến thắng trước nhà vô địch cờ vây thế giới.

Một trong các thách thức là đào tạo cho các thuật toán chơi loạt trò chơi được phát triển bởi Atari. Trong năm 2013, DeepMind cho biết có thể sử dụng Deep Q-Learning – sự kết hợp giữa học tăng cường và mạng nơ-ron tích chập (convolutional neural networks) để vượt qua 7 trò chơi của Atari. Vấn đề là phải dạy thuật toán kiểm soát hình ảnh người ảo trong máy vật lý. Để làm điều này, thuật toán bắt đầu với quá trình ngẫu nhiên, chẳng hạn như tập hợp các cách để đạt điểm cao trong trò chơi của Atari. Sau đó, nó sẽ tạo ra vài trăm biến thể từ phương án gốc, với một số biến thể ngẫu nghiên và chúng bắt đầu thử nghiệm trên trò chơi.

Các phương án được tập hợp lại, trộn lẫn với nhau, ưu tiên số lớn hơn cho từng “nước đi” mang lại điểm số cao. Quá trình lặp lại cho đến khi hệ thống đưa ra được giải pháp tốt nhất để vượt qua trò chơi. Được biết, trong một giờ huấn luyện với thử thách của Atari, thuật toán của OpenAI đã đạt được mức độ thành thạo tương tự như hệ thống của DeepMind công bố năm 2016, vốn cần một ngày để đạt level tương đương. Về khả năng điều khiển nhân vật đi bộ, nó chỉ mất 10 phút so với 10 giờ theo cách tiếp cận của Google.

Cách làm của OpenAI không cần “truyền ngược sai số”, kỹ thuật phổ biến trong phương pháp huấn luyện mạng nơ-ron, thay vào đó sẽ so sánh kết quả cuối của của mạng lưới với yêu cầu ban đầu, sau đó cung cấp thêm thông tin trở lại để mạng lưới tối ưu hóa. Các nhà nghiên cứu cho biết, như vậy sẽ giúp mã code ngắn hơn và thuật toán xử lý nhanh gấp hai đến 3 lần. Nó đồng thời cũng phù hợp với tình huống và thách thức có thời gian lâu hơn.

Tuy nhiên, cách tiếp cận vẫn có một số hạn chế. Thuật toán được so sánh dựa trên tính hiệu quả của dữ liệu, chẳng hạn như thực hiện lặp lại cho tới khi đạt được điểm số cần thiết. Phương pháp tiếp cận của OpenAI tỏ ra “đơn điệu” hơn so với các phương pháp học tăng cường, vốn không có kết quả đúng sai. Nhưng OpenAI xử lý công việc song song, nên có thể lặp lại quá trình nhanh hơn.

Dự án mà Elon Musk đầu tư đưa ra cách tiếp cận đầy hứa hẹn. Tuy nhiên, họ cũng gặp phải sự cạnh tranh quyết liệt từ các công ty công nghệ khác. Google hiện đang thử nghiệm nhiều chiến lược khác nhau để đưa ra thuật toán nhận diện hình ảnh tốt hơn. AI sẽ còn “tiến hóa” trong thời gian tới và sẽ sớm có những đột phá mới hữu ích cho nhân loại.

57Vote

43Vote

34Vote

24Vote

14Vote

3.222

Từ khóa :
OpenAI
,
DeepMind
,
Google

Trước Sau

In Trang

Gửi ý kiến của bạn

Tắt

Telex

VNI

Tạo bài viết

facebook-se-cho-phep-chen-nhac-co-san-vao-video-va-ho-tro-lam-video-360

Facebook Sẽ Cho Phép Chèn Nhạc Có Sẵn Vào Video Và Hỗ Trợ Làm Video 360

11 Tháng Mười Hai 2017

Facebook đã nhận ra rằng một đoạn nhạc phù hợp thậm chí có thể khiến một video nhàm chán trở nên nhiều phần thú vị hơn. Khoảng giữa tháng 12/2017, Facebook đã ra mắt công cụ chỉnh sửa video có tên Sound Collection – Bộ sưu tập Âm thanh, có chức năng cho phép người dùng chèn vào video Facebook/Instagram của mình những bài hát, những câu hát, âm thanh, giai điệu từ khắp các thể loại nhạc như hip hop, pop, jazz, country và nhiều hơn...

google-maps-se-nhac-nho-nguoi-dung-khi-sap-den-tram-xuong-xe-bus

Google Maps Sẽ Nhắc Nhở Người Dùng Khi Sắp Đến Trạm Xuống Xe Bus

11 Tháng Mười Hai 2017

Trong tương lai, người dùng sẽ không sợ quên xuống trạm xe bus, vì Google Maps sẽ cập nhật tính năng nhắc đã tới trạm.

youtube-se-ra-mat-dich-vu-nhac-moi-vao-thang-03-2018

YouTube Sẽ Ra Mắt Dịch Vụ Nhạc Mới Vào Tháng 03/2018

08 Tháng Mười Hai 2017

Khoảng đầu tháng 12/2017, một số nguồn tin cho biết, dịch vụ stream nhạc mới của YouTube sẽ được ra mắt vào tháng 03/2018 với tên gọi Remix. Hồi tháng 07/2017, Lyor Cohen, trưởng bộ phận âm nhạc của YouTube, cũng đã tiết lộ công ty đang có kế hoạch kết hợp dịch vụ YouTube Red với Google Play Music.

ung-dung-file-go-chinh-thuc-co-mat-tren-play-store

Ứng Dụng File Go Chính Thức Có Mặt Trên Play Store

07 Tháng Mười Hai 2017

Khoảng đầu tháng 12/2017, sau một thời gian thử nghiệm, Google đã chính thức phát hành Files Go trên cửa hàng ứng dụng Play Store. Files Go là một trình quản lý tệp tin được xây dựng dành riêng cho các thiết Android có cấu hình thấp, RAM từ 1 GB trở xuống, và bộ nhớ trong khiêm tốn.

ung-dung-ban-phim-android-lam-lo-thong-tin-cua-31-trieu-nguoi-dung

Ứng Dụng Bàn Phím Android Làm Lộ Thông Tin Của 31 Triệu Người Dùng

06 Tháng Mười Hai 2017

Khoảng đầu tháng 12/2017, trung tâm An ninh Kromtech cho biết có đến 31 triệu người dùng bị đánh cắp hoặc rò rỉ thông tin cá nhân khi sử dụng ứng dụng bàn phím Android nổi tiếng AI.type, hậu quả sau những nỗ lực bảo vệ cơ sở dữ liệu máy chủ không thành công của đội ngũ lập trình viên.

firefox-beta-cho-android-co-ho-tro-nghe-nhac-flac-chat-luong-cao

Firefox Beta Cho Android Có Hỗ Trợ Nghe Nhạc FLAC Chất Lượng Cao

06 Tháng Mười Hai 2017

Khoảng đầu tháng 12/2017, Mozilla ra mắt phiên bản beta mới cho trình duyệt Firefox trên các thiết bị Android, có hỗ trợ phát âm thanh định dạng FLAC, hỗ trợ thêm nhiều ngôn ngữ, và đi kèm một số cải tiến khác. Ứng dụng Firefox Beta sẽ giúp Mozilla thử nghiệm các tính năng mới nhất trước khi ra mắt bản chính thức cho người dùng.