Trí Tuệ Nhân Tạo “Rosetta” Kiểm Duyệt Hàng Tỷ Hình Ảnh Trên Facebook Mỗi Ngày

12 Tháng Chín 20181:57 SA(Xem: 579)
Trí Tuệ Nhân Tạo “Rosetta” Kiểm Duyệt Hàng Tỷ Hình Ảnh Trên Facebook Mỗi Ngày
Trí Tuệ Nhân Tạo “Rosetta” Kiểm Duyệt Hàng Tỷ Hình Ảnh Trên Facebook Mỗi Ngày

Mọi người online trên mạng Internet có xu hướng giao tiếp không chỉ bằng lời nói, mà còn bằng hình ảnh. Đối với một nền tảng như Facebook với hơn 2 tỷ người dùng hoạt động hàng tháng, có nghĩa là rất nhiều hình ảnh được đăng mỗi ngày. Để hiển thị những hình ảnh có chữ đi kèm trong kết quả tìm kiếm ảnh có liên quan, để cung cấp cho người đọc những nội dung được viết trên ảnh và để đảm bảo những bức ảnh đó không chứa ngôn từ kích động thù địch và các ngôn từ khác vi phạm chính sách nội dung của trang web, Facebook đã tạo và triển khai một hệ thống máy học quy mô lớn có tên là "Rosetta".

 

Facebook cần một hệ thống nhận dạng ký tự quang học có thể xử lý thường xuyên khối lượng lớn nội dung, vì vậy hãng phải tạo ra công nghệ riêng của mình. Theo mạng xã hội Facebook, Rosetta trích xuất văn bản từ hơn một tỷ hình ảnh và khung hình video bằng nhiều ngôn ngữ khác nhau mỗi ngày trong thời gian thực.

 

Trong một bài đăng blog mới, công ty giải thích cách Rosetta hoạt động, công cụ sẽ bắt đầu bằng cách phát hiện các vùng hình chữ nhật trong các hình ảnh có khả năng chứa văn bản. Sau đó, nó sử dụng mạng lưới thần kinh để nhận biết và phiên âm những gì được viết trong khu vực đó, ngay cả từ không phải tiếng Anh hoặc bảng chữ cái không phải tiếng Latinh, chẳng hạn như tiếng Ả Rập và tiếng Hindi. Để đào tạo hệ thống, Facebook đã sử dụng một hỗn hợp các hình ảnh công cộng được chú thích bởi con người và máy.

 

Các đội nhóm khác nhau trong Facebook và Instagram sẽ sử dụng Rosetta để hiển thị nhiều nội dung hơn và giám sát nền tảng. Công ty có kế hoạch tiếp tục phát triển số lượng ngôn ngữ mà Rosetta có thể hiểu và làm cho công cụ tốt hơn trong việc trích xuất văn bản từ các khung hình video.

 

Về ngôn ngữ, Facebook cũng đã thêm 24 ngôn ngữ mới vào các dịch vụ dịch thuật tự động, bao gồm Serbia, Belarus, Marathi, Sinhalese, Telugu, Nepali, Kannada, Urdu, Punjabi, Campuchia, Pashto, Mông Cổ, Zulu, Xhosa và Somali. Facebook thừa nhận rằng các bản dịch cho những ngôn ngữ vẫn ở giai đoạn đầu, nên sẽ vẫn còn nhiều lỗi. Hãng có kế hoạch sẽ tiếp tục cải thiện, và giới thiệu nhiều ngôn ngữ hơn trong tương lai.

512Vote
40Vote
30Vote
20Vote
10Vote
512
Gửi ý kiến của bạn
Tắt
Telex
VNI
Tên của bạn
Email của bạn
Tạo bài viết
20 Tháng Hai 2019
Eta Carinae có thể sắp sửa nổ tung. Nhưng không ai biết khi nào - có thể là năm sau, cũng có thể là một triệu năm nữa. Khối lượng của Eta Carinae - lớn hơn Mặt trời khoảng 100 lần - khiến nó trở thành một ứng cử viên xuất sắc cho siêu tân tinh toàn diện. Các ghi chép lịch sử cho thấy khoảng 170 năm trước, Eta Carinae đã trải qua một vụ nổ bất thường, khiến nó trở thành một trong những ngôi sao sáng nhất trên bầu trời phía nam.
20 Tháng Hai 2019
Trong thời gian qua, giới công nghệ đã liên tục được thấy những hình ảnh và thông tin đồn đoán của bộ ba Galaxy S10 sắp được Samsung ra mắt. Tuy nhiên, có một thiết bị bí ẩn mà chúng ta chưa một lần được thấy hình ảnh thật sự - chiếc smartphone màn hình gập Galaxy Fold.
20 Tháng Hai 2019
Khoảng giữa tháng 02/2019, GlobalFoundries, hãng gia công chip bán dẫn lớn thứ 3 thế giới sau TSMC và Samsung, đang được rao bán bởi các nhà đầu tư. GlobalFoundries đã thất bại trong việc phát triển dây chuyền sản xuất 7 nm và đang bị bỏ rơi bởi chính đối tác lớn nhất của họ là AMD.
20 Tháng Hai 2019
Khoảng giữa tháng 02/2019, một số nguồn tin cho biết, những công nghệ như theo dõi dây đeo tay, giám sát video và robot phát hiện ma túy đang được sử dụng thử nghiệm trong nhà tù tại Hồng Kông.
20 Tháng Hai 2019
Khoảng giữa tháng 02/2019, trong một cuộc phỏng vấn công khai đầu tiên kể từ khi con gái ông – CFO của Huawei - Meng Wanzhou (Mạnh Vãn Châu) bị bắt vào tháng 12/2018. Ông Nhậm chia sẻ với BBC rằng các cáo buộc và cáo trạng hình sự của chính phủ Mỹ bao gồm gian lận và ăn cắp bí mật thương mại sẽ chẳng bao giờ có thể “đè bẹp” Huawei.
20 Tháng Hai 2019
Razer là một hãng sản xuất gaming gear nổi tiếng, nhưng lại có tham vọng lấn sân sang mảng smartphone với dòng sản phẩm Razer Phone. Được quảng bá là smartphone chơi game hàng đầu, nhưng Razer Phone vẫn vấp phải sự cạnh tranh gay gắt từ những chiếc smartphone flagship cao cấp.