Chương Trình Máy Tính Có Thể Nhận Diện Các Gương Mặt Và Hoạt Động Diễn Ra Trong Một Hình Ảnh

19 Tháng Bảy 20157:00 CH(Xem: 11777)

Đội ngũ nghiên cứu ở trường Đại Học Stanford đã phát triển một chương trình máy tính, gọi là NeuralTalk.

Chương trình mới có khả năng phân tích và diễn đạt những gì đang diễn ra trong một bức ảnh với độ chính xác khá cao. NeuralTalk có cách thức hoạt động tương tự như mạng nơ ron nhân tạo của Google, nhưng mức độ "thông minh" được cho là vượt trội hơn rất nhiều.

Theo đó, dự án NeuralTalk và những nghiên cứu đi kèm được công bố hồi đầu năm 2015, bởi nghiên cứu sinh Fei-Fei Li, trưởng phòng thí nghiệm trí thông minh nhân tạo tại Đại học Stanford.

Về cơ bản, hệ thống mới có khả năng nhận diện một bức ảnh với bối cảnh phức tạp và xác định chính xác điều gì đang diễn ra. Ví dụ, hệ thống đã xác định được các vật thể nằm trong bức ảnh như một người đàn ông, một con mèo, một cái laptop. Thậm chí, nó có thể biết được rằng "một người đang ông đang sử dụng laptop trong khi con mèo của ông ấy đang nhìn vào trong màn hình."

Cách thức hoạt động của NeuralTalk tương tự như hệ thống mạng nơ ron nhân tạo do Google phát triển. Nó dùng mạng nơ ron để phân tích bức ảnh, so sánh những gì nó "thấy được" với những hình ảnh "đã nhìn thấy trước đó" và diễn tả bức ảnh bằng các câu có nghĩa. Khi NeuralTalk học được những điều cơ bản của thế giới, chẳng hạn như cửa sổ trông như thế nào, cái bàn trông ra sao, cảnh tượng con mèo sắp ăn như thế nào… thì nó hoàn toàn có thể áp dụng sự hiểu biết vào những hình ảnh và video cụ thể.

Tuy nhiên, NeuralTalk không phải lúc nào cũng có thể cho ra những kết quả hoàn hảo. Nhưng trong hầu hết các bức ảnh, ngoài danh sách những vật thể được nhận diện, hệ thống còn trả về những câu miêu tả phụ và trong đó có những câu nói đúng về bức ảnh. Nhóm nghiên cứu đã tạo nên một trang web, trong đó demo khả năng hiện tại của NeuralTalk, có cả đúng lẫn sai.

Với đà phát triển của công nghệ, hiện nay, lượng thông tin khổng lồ trên Internet đều được dán nhãn thủ công bởi con người, để có thể tìm kiếm được. Thậm chí, khi Google mới phát triển Google Maps, một đội ngũ nhân viên đã phải kiểm tra thủ công từng mục, để đảm bảo các ký hiệu trên bản đồ là đúng.

Sau đó, Google Brain được tạo ra, những việc mà con người mất 1 tuần để làm thì hệ thống chỉ mất 1 giờ. Từ đây, kỹ thuật dụng mạng nơ ron đã bắt đầu được chú ý. Một điểm thú vị trong cách tiếp cận của nhóm nghiên cứu tại Stanford là, sau khi nhận diện được hình ảnh, hệ thống còn có khả năng trả về kết quả bằng câu diễn đạt có nghĩa.

Cách thức mới có thể được áp dụng nhằm nâng độ độ chính xác và trải nghiệm người dùng trong việc tìm kiếm hình ảnh. Người dùng chỉ cần gõ chính một câu tự nhiên để tìm kiếm - thay vì phải tìm trong số hàng tỷ hình ảnh - hệ thống sẽ tự động dựa vào danh từ, động từ… trong câu truy vấn, để đưa ra các kết quả tốt hơn.

Ngoài ra, công nghệ mới còn có thể được áp dụng để quét hình ảnh thời gian thực, trang bị trên các phương tiện giao thông, kính thực tế ảo…. Như vậy, một chiếc kính có khả năng phân tích toàn diện, giống như trong các loạt phim khoa học viễn tưởng, không phải là tương lai quá xa vời.

52Vote

40Vote

30Vote

21Vote

10Vote

Trước Sau

In Trang

Gửi ý kiến của bạn

Tắt

Telex

VNI

Tạo bài viết

opera-ra-mat-trinh-duyet-opera-touch-moi

Opera Ra Mắt Trình Duyệt Opera Touch Mới

27 Tháng Tư 2018

Khoảng cuối tháng 04/2018, Opera ra mắt trình duyệt di động mới mang tên Opera Touch cho thiết bị iOS và Android.

phat-hien-phan-mem-doc-hai-roaming-mantis-dang-tan-cong-cac-smartphone-o-chau-a

Phát Hiện Phần Mềm Độc Hại Roaming Mantis Đang Tấn Công Các Smartphone Ở Châu Á

25 Tháng Tư 2018

Khoảng cuối tháng 04/2018, các nhà nghiên cứu tại Kaspersky Lab đã phát hiện phần mềm độc hại mới trên Android tấn công vào smartphone ở khu vực Châu Á thông qua DNS, có tên là Roaming Mantis.

microsoft-translator-da-co-che-do-dich-offline

Microsoft Translator Đã Có Chế Độ Dịch Offline

21 Tháng Tư 2018

Dù các ứng dụng dịch thuật vẫn hoạt động được khi offline, chúng không thể sử dụng những thuật toán phức tạp trong đám mây để hỗ trợ việc dịch. Nhưng ứng dụng Microsoft Translator trên Amazon Fire, Android và iOS sẽ khắc phục được vấn đề.

Google Sẽ Ra Mắt Ứng Dụng Nhắn Tin Mới

20 Tháng Tư 2018

Khoảng giữa tháng 04/2018, dù rất nỗ lực phát triển các ứng dụng nhắn tin, trò chuyện và thực hiện video call cho hệ điều hành Android, nhưng Google chưa có một ứng dụng có thể mang lại trải nghiệm tuyệt vời như những gì iMessage mang lại cho những người dùng iPhone và iPad.

chevrolet-va-shell-gioi-thieu-tinh-nang-moi-cho-phep-thanh-toan-tien-do-xang-tu-man-hinh-trong-xe

Chevrolet Và Shell Giới Thiệu Tính Năng Mới, Cho Phép Thanh Toán Tiền Đổ Xăng Từ Màn Hình Trong Xe

20 Tháng Tư 2018

Khoảng giữa tháng 04/2018, Chevrolet và Shell cùng hợp tác giới thiệu một tính năng mới, cho phép người lái trực tiếp trả tiền đổ nhiên liệu từ màn hình cảm ứng trong xe. Đây là khởi đầu của General Motors hướng đến tương lai mà người dùng chỉ cần ngồi ở ghế lái và có thể trả tiền xăng, mua cà phê hay đặt bàn nhà hàng bằng các thao tác đơn giản. So với các phương thức khác vốn dùng điện thoại hay quẹt thẻ, người dùng sẽ chỉ cần thao tác ngay trên hệ thống thông tin giải trí của xe và một phần của trụ bơm.

amazon-mo-rong-ho-tro-them-mot-so-ngon-ngu-va-tien-te

Amazon Mở Rộng Hỗ Trợ Thêm Một Số Ngôn Ngữ Và Tiền Tệ

19 Tháng Tư 2018

Khoảng giữa tháng 04/2018, Amazon cập nhật ứng dụng dành cho thiết bị di động với tính năng Trải nghiệm Mua sắm quốc tế mới, cho phép dễ dàng mua sắm các sản phẩm trên Amazon ờ nước ngoài bằng ứng dụng.