Facebook Đang Sở Hữu Công Nghệ Dịch Thuật Chính Xác Và Nhanh Hơn 9 Lần So Với Các Đối Thủ

11 Tháng Năm 20178:00 CH(Xem: 15765)
Facebook Đang Sở Hữu Công Nghệ Dịch Thuật Chính Xác Và Nhanh Hơn 9 Lần So Với Các Đối Thủ
Facebook Đang Sở Hữu Công Nghệ Dịch Thuật Chính Xác Và Nhanh Hơn 9 Lần So Với Các Đối Thủ
Dịch thuật đã trở thành một trong những ứng dụng quan trọng nhất của hệ thống AI (trí tuệ nhân tạo) của Facebook. Mục tiêu của mạng xã hội là “làm thế giới cởi mở và liên kết với nhau nhiều hơn”, nên rào cản về mặt ngôn ngữ chắc chắn là một chướng ngại.

Khoảng giữa tháng 05/2017, Facebook đã chính thức giới thiệu một phương thức dịch thuật nhờ sử dụng machine-learning (công nghệ máy học), có tốc độ “đọc hiểu” nhanh gấp 9 lần so với các đối thủ cùng lĩnh vực. Sản phẩm hiện còn đang ở giai đoạn nghiên cứu, và chưa được tích hợp vào bất kỳ ứng dụng nào của Facebook. Michael Auli và David Grangier, kỹ sư nghiên cứu về trí tuệ nhân tạo của Facebook, chia sẻ rằng sẽ phải mất thêm một thời gian khá dài nữa để công nghệ mới được đưa vào sử dụng.

Mạng xã hội Facebook vốn đã sử dụng AI (trí tuệ nhân tạo) để thực hiện tự động một số công việc như dịch các dòng cập nhật trạng thái sang ngôn ngữ khác, nhưng để đưa nó từ một thử nghiệm thành sản phẩm thực tế sẽ phải tra qua rất nhiều công đoạn.

Grangier cho biết: “Chúng tôi hiện đang tiến hành đàm phán với đội ngũ quản lý sản phẩm để giúp phương thức mới hoạt động trơn tru, mượt mà trong môi trường của Facebook. Có rất nhiều sự khác biệt khi chuyển từ thu thập và xử lý dữ liệu học thuật sang môi trường ngôn ngữ thực tế. Dữ liệu học thuật là thông tin kiểu mới, trong khi những cuộc trò chuyện trên Facebook lại thường thông tục, phổ biến hơn”. Trước đây, Facebook đã từng đề cập đến việc đang xây dựng một vốn từ lóng để khiến quá trình trở nên đơn giản hơn.


Phương thức Facebook lựa chọn để tiếp cận với machine-learning đang bắt đầu gặt hái được thành quả. Những cỗ máy dịch thuật sử dụng AI đều phải phụ thuộc vào Recurrent Neural Networks, nhưng phương thức mới nghiên cứu được lại tận dụng Convolutional Neural Networks.

Cụ thể, RNNs phân tích dữ liệu theo chuỗi, đọc một câu từ trái sang phải, theo thứ tự đúng để có thể dịch được nghĩa theo kiểu từng từ một (word by word). CNNs thì nghiên cứu nhiều phương diện của dữ liệu một cách liên tục, tương thích hơn rất nhiều với GPU phần cứng được sử dụng để huấn luyện những neural networks hiện đại. GPU ban đầu được thiết kế để xử lý hình ảnh trong trò chơi điện tử, và cũng thể hiện rất tốt trong việc thực hiện các phép tính nhỏ.

Do đó, việc chuyển sang sử dụng mô hình CNNs nghĩa là Facebook sẽ giải quyết dược vấn đề về câu tối nghĩa, đồng thời phân tích câu cú và ngữ pháp ở mức độ cao hơn. CNNs xây dựng một cấu trúc có logic hơn, thậm chí được đánh giá là ngang tầm với các nhà ngôn ngữ học, chứ không đơn thuần là dịch từng chữ rồi ghép chúng lại thành một câu.
510Vote
41Vote
30Vote
23Vote
10Vote
4.314
Gửi ý kiến của bạn
Tắt
Telex
VNI
Tên của bạn
Email của bạn
Tạo bài viết
24 Tháng Chín 2019
Khoảng cuối tháng 09/201, start up xe điện Rivian tiếp tục nhận thêm tin vui từ Amazon với đơn đặt hàng 100,000 chiếc xe tải giao hàng chạy điện (electric delivery truck) .
24 Tháng Chín 2019
Khoảng cuối tháng 09/2019, Facebook tuyên bố đã gỡ bỏ hàng chục nghìn ứng dụng đang tồn tại trên nền tảng mạng xã hội – đây là một phần trong cuộc điều tra nội bộ bắt đầu vào tháng 03/2018, sau vụ scandal Cambrigde Analytica đã khiến hãng phải đóng khoản phạt 5 tỷ USD.
24 Tháng Chín 2019
Khoảng cuối tháng 09/2019, sau một số thông tin rằng Nhà Trắng sẽ cấm bán hầu hết các vị của thuốc lá điện tử, chuỗi cửa hàng tiện lợi Walmart tại Mỹ cũng đã quyết định ngừng bán tất cả các loại thuốc lá điện tử. Chuỗi cửa hàng bán lẻ lớn nhất thế giới tuyên bố sẽ không phân phối các thiết bị liên quan đến thuốc lá điện tử ngay sau khi giải quyết hết lượng tồn kho, kể cả những thương hiệu lớn nổi tiếng như Juul cũng sẽ không được tiếp tục bán.
23 Tháng Chín 2019
Khoảng cuối tháng 09/2019, theo một báo cáo của Ủy ban Giám sát Ứng phó Toàn Cầu (Global Preparedness Monitoring Board - GPMB), đại dịch tiếp theo xảy ra trên quy mô toàn cầu có thể giết chết từ 50-80 triệu người. Điều đáng nói là tất cả chúng ta đều chưa có sự chuẩn bị tốt cho đại dịch nếu nó xảy ra.
23 Tháng Chín 2019
Khoảng cuối tháng 09/2019, để giúp những người nghiện thuốc lá có thêm 1 lựa chọn trong việc cai thuốc, một ủy ban độc lập của FDA đang khuyến nghị tổ chức cho phép hãng dược phẩm GlaxoSmithKline Plc bán loại nicotin dạng xịt trên thị trường Mỹ theo kiểu bán tại quầy không cần kê đơn.
23 Tháng Chín 2019
Khoảng giữa tháng 09/2019, một sự kiện có tên là "Storm Area 51" (Đột nhập Area 51) được đăng tải trên Facebook nhằm kêu gọi mọi người cùng đi săn người ngoài hành tinh vào ngày 20/09/2019 tại thành phố Rachel, bang Nevada. Sau đó, sự kiện được chuyển thành một bữa tiệc cuối tuần với tên Alienstock. Tuy nhiên, giới chức trách địa phương cho biết có thể họ sẽ kiện những người chịu trách nhiệm cho hành động nguy hiểm của tập thể.