Chức Năng Nhận Diện Giọng Nói Của Microsoft Đã Đạt Mức Chính Xác Như Con Người

21 Tháng Mười 20167:00 CH(Xem: 24205)
Chức Năng Nhận Diện Giọng Nói Của Microsoft Đã Đạt Mức Chính Xác Như Con Người
blank
Trung tuần tháng 10/2016, Microsoft công bố đội ngũ kỹ sư ở mảng AI của bộ phận Research đã phát triển độ chính xác của tính năng nhận diện giọng nói của AI lên mức gần như con người.

Được biết, con người có khả năng ghi nhận lại những đoạn hội thoại bằng lời với tỷ lệ chính xác trung bình 94.1%. Còn hệ thống trí tuệ nhân tạo (AI) của Microsoft cũng đã đạt mức độ tương tự. Cụ thể, giám đốc bộ phận nhận diện giọng nói Xuedong Huang của Microsoft cho biết: “Chúng tôi đã đạt tới hiệu suất của con người. Đây là một thành công mang tính lịch sử”

Trong tháng 09/2016, Microsoft từng tuyên bố rằng khả năng nhận diện giọng nói của AI đã đạt mức 6.3% lỗi. Đến trung tuần tháng 10/2016, tỷ lệ lỗi đã được xuống chỉ còn 5.9%. Để đạt được mức độ đó, đội ngũ của Microsoft đã áp dụng mô hình nhận diện ngôn ngữ mang tính kế thừa dựa trên mạng nơ-ron nhân tạo kết hợp với đám mây từ ngữ.


Theo đó, những từ như "fast", "quick", đều diễn tả sự nhanh chóng, sẽ được đặt với nhau theo cùng một nhóm (vector) nhằm giúp hệ thống AI có thể nhận diện ra dễ dàng hơn trong phép so sánh với nhóm những từ có nghĩa "chậm".

Nhờ đó, hệ thống AI của Microsoft có thể khái quát hóa các từ ngữ và nhận diện chúng tốt hơn trong các ngữ cảnh khác nhau. Toàn bộ hệ thống mới đều được xây dựng dựa trên hệ thống deep-learning Computational Network Toolkit do chính Microsoft phát triển.

Nhóm nghiên cứu cho biết sẽ đặt ra mục tiêu là hoàn thiện mức độ tin cậy của hệ thống nhận diện giọng nói, cho phép nó có thể được sử dụng trong các tình huống đời thật, chẳng hạn như trên đường phố đông đúc hoặc lúc đang lái xe,… Ngoài ra, nhóm cũng hy vọng rằng hệ thống AI sẽ có khả năng tương tác với nhiều người dùng khác nhau cùng lúc trong một đoạn hội thoại tiếp diễn liên tục.
516Vote
40Vote
32Vote
21Vote
11Vote
4.520
Gửi ý kiến của bạn
Tắt
Telex
VNI
Tên của bạn
Email của bạn
Tạo bài viết
13 Tháng Mười 2019
Với hầu hết mọi người, người thầy đầu tiên của tất cả chúng ta là cha mẹ. Chúng ta học nói ngôn ngữ của loài người, bắt đầu bằng cách nhại lại những gì cha mẹ chúng ta từng nói. Nhưng thử tưởng tượng một ngày nào đó, người khác có thể "hack" vào quá trình đó.
13 Tháng Mười 2019
Dịch vụ stream nhạc Apple Music được giới thiệu từ năm 2015 và đang tăng trưởng với tốc độ chóng mặt
13 Tháng Mười 2019
Khoảng đầu tháng 10/2019, báo cáo từ TF Securities và nhà phân tích Ming Chi Kuo gợi ý Apple chuẩn bị ra mắt hàng loạt sản phẩm mới vào nửa đầu năm 2020, bao gồm kính thông minh hợp tác với bên thứ ba.
12 Tháng Mười 2019
iPhone SE 2 được dự đoán ra mắt đầu năm 2020, mang kiểu dáng của iPhone 8 và vi xử lý của iPhone 11.
12 Tháng Mười 2019
Đẹp đẽ và mang dáng dấp tương lai, nhưng thiết kế của màn hình thác nước lại mang tính khoa trương về công nghệ kỹ thuật của nhà sản xuất hơn là hướng tới trải nghiệm người dùng.
12 Tháng Mười 2019
Viên kim cương hai trong một được phát hiện tại một mỏ ở Siberia của Nga và được đặt tên là Kim cương Matryoshka, theo tên của búp bê Matryoshka truyền thống của nước Nga.