Khoảng cuối tháng 06/2017, một số nguồn tin cho biết, mạng thần kinh nhân tạo mới MultiModel của Google hứa hẹn sẽ khiến AI có thể hành động đa nhiệm.
Theo đó, các hệ thống học sâu (deep-learning) có xu hướng trở thành bước đột phá trong lĩnh vực mà chúng tập trung, chúng sẽ vô cùng xuất sắc ở bất cứ tác vụ nào được huấn luyện, nhưng đồng thời sẽ khá tệ ở mọi tác vụ khác.
Tuy nhiên, mạng thần kinh nhân tạo mới từ Google hứa hẹn sẽ khiến AI cuối cùng cũng có thể hành động đa nhiệm. Hầu hết các hệ thống học sâu được xây dựng để giải quyết một tổ hợp các vấn đề cụ thể, chẳng hạn như nhận diện động vật từ hình ảnh hay dịch giữa các ngôn ngữ với nhau. Nhưng nếu lấy một thuật toán bất kỳ, như là nhận diện hình ảnh, rồi tái huấn luyện để nó thực hiện một nhiệm vụ khác, như là nhận diện giọng nói, nó thường sẽ trở nên tệ hại khi trở lại với phần tác vụ trước đó. Trong đó, con người dường như không bị vấn đề này. Con người sử dụng kiến thức một cách tự nhiên để giải quyết các tác vụ mới mà hiếm khi quên đi các kĩ năng sẵn có của mình.
Mạng thần kinh nhân tạo mới của Google đã tạo nên một bước ngoặt nhỏ tới khả năng tương tự như của con người, bằng việc học một cách đồng thời giải quyết một loạt các vấn đề mà không chuyên hóa vào bất cứ vấn đề nào. Cụ thể, mạng thần kinh nhân tạo từ Google Brain – một trong những nhóm nghiên cứu học sâu của công ty – đã học được cách thực hiện đến 8 tác vụ cùng lúc, bao gồm nhận diện ảnh và giọng nói, cùng với việc phân tích câu và dịch. Hệ thống mới được gọi là MultiModel, được tạo nên bởi một mạng thần kinh trung tâm vây quanh bởi các mạng thứ cấp được chuyên hóa trong các tác vụ cụ thể có liên quan đến văn bản, hình ảnh và âm thanh.
Dù MultiModel không phá vỡ bất cứ kỉ lục nào cho số tác vụ có thể đảm nhiệm, nhưng nó có hiệu suất khá cao. Với độ chính khoảng 88.6%, khả năng nhận diện hình ảnh của nó chỉ kém 9% so với các thuật toán chuyên hóa tốt nhất - và bắt kịp khả năng của các thuật toán tốt nhất đã sử dụng trong 5 năm trở lại.
Hệ thống mới cũng cho thấy các lợi ích khác. Các hệ thống học sâu thường cần được luyện tập với một lượng lớn dữ liệu để hoàn thành tốt tác vụ. Còn MultiModel có một ý tưởng rất hay để vượt qua rào cản, bằng cách học hỏi từ những dữ liệu liên quan đến các tác vụ hoàn toàn khác. Chẳng hạn như khả năng của mạng trong việc phân tích ngữ pháp các câu được cải thiện rõ rệt khi nó được tập luyện trên một nền tảng dữ liệu hình ảnh, dù dạng dữ liệu không liên quan đến phân tích câu.
Sebastian Ruder, thuộc Trung tâm nghiên cứu Dữ liệu Phân tích ở Dublin, Ireland, đã rất ấn tượng với phương hướng tiếp cận của Google. Nếu một mạng thần kinh nhân tạo có thể sử dụng chính kiến thức của nó để tự giải quyết các vấn đề khác, nó hoàn toàn có thể cải thiện khả năng của mình với những vấn đề rất khó học vì thiếu dữ liệu hữu ích. Đây là chìa khóa giúp tiến gần hơn đến trí thông minh phổ quát nhân tạo.
Google đã phát hành các dòng code của MultiModel, vốn là một phần của dự án mã nguồn mở TensorFlow, giúp cho các kĩ sư có cơ hội thử nghiệm với mạng thần kinh nhân tạo và đưa vào thử nghiệm. Tuy nhiên, sự phức tạp của mạng lưới mới có thể sẽ gây khó khăn cho các nhà nghiên cứu trong việc tìm ra lý do đàng sau các kĩ năng đa nhiệm của nó.
- Từ khóa :
- ,
- AI
- ,
- MultiModel
Gửi ý kiến của bạn