Qualcomm Tiết Lộ Chương Trình Nhận Diện Giọng Nói Mới

28 Tháng Năm 20182:29 SA(Xem: 12800)
Qualcomm Tiết Lộ Chương Trình Nhận Diện Giọng Nói Mới
Qualcomm Tiết Lộ Chương Trình Nhận Diện Giọng Nói Mới
Qualcomm Tiết Lộ Chương Trình Nhận Diện Giọng Nói Mới

Khoảng cuối tháng 05/2018, trong Hội nghị thượng đỉnh Re-Work Deep Learning diễn ra tại thành phố Boston, Mỹ, Qualcomm đã tiết lộ những thông tin đầu tiên về chương trình nhận diện giọng nói hoàn toàn mới của hãng.

 

Chris Lott, chuyên gia nghiên cứu về trí tuệ nhân tạo AI tại Qualcomm cho biết, công nghệ mới sẽ bao gồm 2 mạng neural riêng biệt: mạng neural hồi quy RNN, sử dụng bộ nhớ nội bộ để xử lý thông tin đầu vào; và mạng neural tích chập CNN, mô phỏng lại kết cấu của các nơ-ron trong não bộ con người.

 

Chris Lott khẳng định hệ thống nhận diện giọng nói mới của Qualcomm có thể đạt độ chính xác lên đến 95% và được tích hợp trực tiếp vào smartphone và các thiết bị cầm tay khác. Ông cho biết: “Công nghệ của chúng tôi sẽ học được từ thói quen sử dụng thiết bị của người dùng. Nhờ đó, nó có thể cá nhân hóa các hoạt động của mình sao cho phù hợp với họ nhất”.

 

Đa số quá trình xử lý thông tin của các hệ thống nhận diện giọng nói hiện nay đều hoạt động dựa trên nền tảng điện toán đám mây, từ các vi xử lý hay microphone trên smartphone, loa thông minh như Google Home, Echo của Amazon cho đến các thiết bị máy tính Windows có tích hợp trợ lý ảo Cortana của Microsoft. Chỉ cần sử dụng một số lệnh như “OK Google” hay “Hey Cortana” là người dùng đã có thể dễ dàng điều khiển các trợ lý ảo bằng chính giọng nói của mình.

 

Tuy nhiên, những trợ lý ảo lại không thực sự xử lý thông tin đầu vào, là những câu lệnh mà người dùng đưa ra. Chúng chỉ đơn giản chuyển những từ hoặc cụm từ nghe được đến các máy chủ từ xa để thực hiện rất nhiều thuật toán machine-learning phức tạp và đáp ứng nhu cầu của người dùng.

 

Mặt khác, nhiều người tỏ ra lo ngại về vấn đề bảo mật khi cung cấp những dữ liệu giọng nói của mình cho các trợ lý ảo, mà thực chất là các máy chủ đám mây. Cả Alexa và Google Assistant đều ghi lại và gửi đi những từ khóa nhất định đến máy chủ để thực hiện quá trình phân tích. Những từ khóa sẽ không bị xóa bỏ nếu người dùng không cho phép hoặc không muốn. Amazon và Google cũng khẳng định sử dụng công nghệ thu âm giọng nói để cải thiện dịch vụ và đáp ứng nhu cầu của người dùng tốt hơn.

 

Tuy nhiên, trong một số trường hợp, quá trình trên lại diễn ra một cách thiếu an toàn và gây nên hậu quả nghiêm trọng. Chẳng hạn như vụ việc loa thông minh Echo tích hợp Alexa của Amazon đã tự động ghi âm cuộc trò chuyện của một cặp vợ chồng tại Portland rồi gửi ngẫu nhiên cho một số liên lạc trong danh bạ. Lott chia sẻ công nghệ nhận diện giọng nói của Qualcomm có thể giải quyết vấn đề, vì nó được tích hợp trực tiếp vào thiết bị và không phải gửi dữ liệu đến các máy chủ đám mây. Nó có thể ngay lập tức đáp ứng mệnh lệnh của người dùng mà không cần đến kết nối Internet, giúp bảo mật được nâng cao và an toàn hơn.

 

Trong năm 2016, Google đã tạo ra một hệ thống nhận diện giọng nói offline tương tự như Qualcomm và có tốc độ nhanh hơn gấp 7 lần so với các hệ thống online khác. Được biết, hệ thống có dung lượng khoảng 20.3MB, đã trải qua khoảng 2,000 giờ đào tạo về dữ liệu âm thanh và độ chính xác đạt đến 86.5%.

 

Các hệ thống nhận diện giọng nói tích hợp trong thiết bị cũng có những hạn chế của riêng mình. Chẳng hạn những thuật toán được thiết kế để hoạt động ngoại tuyến sẽ không thể kết nối Internet để tìm kiếm mở rộng câu trả lời cho người dùng. Ngoài ra, chúng cũng không thể tận dụng những tiến bộ công nghệ mà các hệ thống đám mây đang được sử dụng, trong đó bao gồm nguồn cơ sở dữ liệu đa dạng hơn.

 

Tuy nhiên, Chris Lott vẫn cho rằng giải pháp của Qualcomm vẫn sẽ mang lại những hiệu quả và lợi ích nhất định: “Công nghệ đám mây có thể thực hiện được rất nhiều thứ, nhưng tôi nghĩ sẽ tốt hơn nếu chúng được tiến hành ngay trên thiết bị của người dùng”.

59Vote
41Vote
37Vote
26Vote
16Vote
329
Gửi ý kiến của bạn
Tắt
Telex
VNI
Tên của bạn
Email của bạn
Tạo bài viết
06 Tháng Mười 2019
Khoảng đầu tháng 10/2019, theo Ủy ban Khiếu nại Chăm sóc Sức khỏe tiểu bang New South Wales (HCCC), một người phụ nữ tự xưng là "nhà trị liệu thuận tự nhiên" ở Úc đã bị cấm hành nghề y tế suốt đời.
06 Tháng Mười 2019
Khoảng đầu tháng 10/2019, ECJ, Tòa án tối cao của Liên minh Châu Âu, đã đưa ra phán quyết, theo đó các tòa án trong EU có thể ra lệnh cho Facebook xóa bỏ bình luận bất hợp pháp của người dùng toàn cầu.
06 Tháng Mười 2019
Khoảng đầu tháng 10/2019, theo một nhà phân tích uy tín, Apple sẽ không ra mắt một chiếc iPhone 11S như thường lệ vào năm 2020. Thay vào đó, hãng dự kiến sẽ đặt tên cho thế hệ iPhone năm 2020 là "iPhone 12". Đây được xem là một bước đột phá từ cách đặt tên iPhone theo truyền thống của hãng.
04 Tháng Mười 2019
Khoảng đầu tháng 10/2019, theo CNET, những cây ATM luôn được thiết kế chắc chắn, khoang chứa tiền gia cố bởi thép siêu cứng rất khó để phá. Tuy nhiên, điểm yếu của cây ATM chính là chiếc máy tính mà người dùng tương tác để rút tiền. Nhiều chuyên gia bảo mật khẳng định vẻ ngoài kiên cố của cây ATM chỉ để che giấu chiếc máy tính cũ kĩ, không an toàn.
04 Tháng Mười 2019
Ẩn trong tầng hầm trung tâm thương mại đặt giữa khu phố giao thương thịnh vượng của tỉnh Quảng Châu, có một “nhà máy” sản sinh ra những hàng hóa giá trị đặc biệt. Không phải quần áo hay giày dép, mà là “cách để bán” những món hàng giá hời đó. Dưới tầng hầm của trung tâm thương mại, người ta thấy một loạt các KOL (Key Opinion Leaders - những người có sức ảnh hưởng trên cộng đồng mạng) đang stream cho hàng trăm ngàn người xem.
04 Tháng Mười 2019
“Không khí ô nhiễm có thể khiến chúng ta nóng nảy, hung hăng hơn” - đây là kết luận của một loạt các nghiên cứu khoa học do các chuyên gia ở đại học bang Colorado, Mỹ tiến hành, kết hợp cả nghiên cứu kinh tế, khoa học khí quyển và thống kê. Kết hợp những yếu tố lại với nhau, các nhà khoa học phát hiện ra rằng, hít thở không khí bị ô nhiễm có liên quan mật thiết đến những hành vi mang tính bạo lực và hung hăng của con người, và có liên quan cả tới tỉ lệ tội phạm, tính riêng tại Mỹ.