Salesforce Tạo Ra Thuật Toán Tự Tóm Tắt Văn Bản Dựa Trên AI

15 Tháng Năm 201710:00 CH(Xem: 17518)

Trước xu hướng con người ngày càng mất nhiều thời gian đọc email, báo điện tử và mạng xã hội, Salesforce đã phát triển một thuật toán sử dụng machine-learning (máy học) để tự động tóm tắt các văn bản dài một cách gọn gàng và chính xác.

Việc tự động tóm tắt sẽ là một trong những công nghệ quan trọng đối với Salesforce – công ty chuyên cung cấp các sản phẩm phục vụ cho hoạt động chăm sóc khách hàng trong doanh nghiệp. Những đoạn văn tóm tắt có thể giúp nhân viên giảm thiểu thời gian đọc email và thông tin mới để tập trung nhiều hơn cho khách hàng của mình.

Salesforce đã sử dụng trí tuệ nhân tạo (AI) phân tích và tóm gọn các đoạn văn. Công ty cho biết đã thực hiện được 2 bước đột phá trong công nghệ xử lý ngôn ngữ tự nhiên là “mô hình phát sinh ngôn từ theo ngữ cảnh” và một “phương pháp huấn luyện các mô hình tóm tắt mới”. Hai mô hình mới sẽ cho phép các nhà nghiên cứu tự động tạo ra các đoạn tóm tắt một cách chính xác và dễ hiểu. Trước đó, Salesforce cũng đã mua lại startup về deep learning (công nghệ học sâu) MetaMind - nhóm nhân sự đứng sau toàn bộ công trình.

Nhóm nghiên cứu MetaMind giải thích, công nghệ tự động tóm tắt văn bản thông thường hoạt động trên 2 nguyên tắc: Extraction và Abstraction. Theo nguyên tắc Extraction, máy tính có thể tóm tắt dựa trên các câu chữ trước đó của văn bản nhưng không được linh hoạt lắm. Còn nguyên tắc Abstraction sẽ cho phép máy đưa thêm từ mới nhưng hệ thống buộc phải hiểu đoạn văn ở mức khá cao mới có thể cho sử dụng từ mới một cách chuẩn xác. Nhờ các mạng neuron trong deep-learning phát huy tác dụng. Chúng có thể xử lý hàng loạt câu ví dụ và cho ra những từ biểu thị ý nghĩa của cả cụm từ, giúp hệ thống lược dịch lại được các đoạn chữ cũng như sinh ra được từ ngữ của riêng nó.

Các nhà nghiên cứu còn cho mô hình xem lại các đoạn văn bản nó đã tóm tắt để có thêm ngữ cảnh. Các mô hình cũng xem lại cả các ví dụ tóm tắt do chính nó thực hiện để đảm bảo không lặp lại trong các đoạn sau.

Bước đột phá thứ hai của Salesforce cách các nhà nghiên cứu huấn luyện cho hệ thống tự học và nâng cấp chính nó. 2 phương pháp được sử dụng là teacher forcing (học dưới sự thúc ép của “giáo viên”) và reinforcement learning (học tăng cường).

Reinforcement learning là phương pháp huấn luyện lấy cảm hứng từ cách động vật học hỏi, từng được Google DeepMind sử dụng để huấn luyện AI chơi video game. Các chuyên gia sẽ cho mô hình tạo ra một chuỗi từ ngữ với kết quả được chấm điểm theo thang đánh giá ROUGE (Recall-Oriented Understudy for Gisting Evaluation). Thuật toán sẽ tự động cập nhật chính nó bằng mức điểm cao hơn, dẫn đến kết quả tóm tắt tốt hơn trong tương lai.

Còn phương pháp Teacher forcing sẽ đánh giá bản tóm tắt theo một quy chuẩn định sẵn có thể cho ra “kết quả rất tốt” nhưng lại không mấy linh hoạt. Các nhà nghiên cứu nhận ra rằng, khi kết hợp các mô hình sẽ thu được kết quả ấn tượng hơn hẳn các hướng tiếp cận khác. Trong các ví dụ được nhóm nghiên cứu MetaMind đưa ra, các đoạn tóm tắt bằng mô hình cho ra kết quả ngắn hơn đáng kể so với văn bản gốc, câu chữ cũng gãy gọn dễ đọc ngang ngửa với bản tóm tắt do người viết.

Dù vậy, nhóm nghiên cứu vẫn còn rất nhiều việc cần làm trước khi đưa công nghệ mới vào thương mại hóa.

511Vote

43Vote

35Vote

216Vote

16Vote

2.941

Từ khóa :
Salesforce
,
MetaMind

Trước Sau

In Trang

Gửi ý kiến của bạn

Tắt

Telex

VNI

Tạo bài viết

apple-xac-nhan-iphone-6s-co-nguy-co-bien-thanh-cuc-gach-

Apple Xác Nhận iPhone 6S Có Nguy Cơ Biến Thành "Cục Gạch", Người Dùng Nên Kiểm Tra Lại Thiết Bị Của Mình

08 Tháng Mười 2019

Khoảng đầu tháng 10/2019, Apple đã xác nhận một lượng nhỏ iPhone 6S và iPhone 6S Plus có thể gặp tình trạng mất nguồn và không thể bật lên được, từ đó biến chúng không khác gì một "cục gạch" đúng nghĩa. Apple cho biết lỗi chỉ ảnh hưởng đến những máy iPhone 6S và iPhone 6S Plus sản xuất từ tháng 10/2018 đến tháng 8/2019.

Giải Nobel Đầu Tiên Năm 2019 – Ba Nhà Khoa Học Phát Hiện Ra Cơ Chế Thích Nghi Oxy Của Tế Bào

07 Tháng Mười 2019

Khoảng đầu tháng 10/2019, tại Viện Karolinska Stockholm, Thụy Điển, giải Nobel năm 2019 đầu tiên đã được trao cho bộ ba nhà khoa học William G. Kaelin Jr, Sir Peter J. Ratcliffe và Gregg L. Semenza. Đây là giải Nobel trong lĩnh vực Sinh lý học và y khoa, dành cho “Phát hiện cơ chế cảm nhận và thích nghi với lượng oxy sẵn có của tế bào”.

y-hoc-crispr-co-the-dung-tieu-diet-vi-khuan-khang-thuoc-khang-sinh

Y Học – CRISPR Có Thể Dùng Tiêu Diệt Vi Khuẩn Kháng Thuốc Kháng Sinh

07 Tháng Mười 2019

Khoảng đầu tháng 10/2019, trong một nghiên cứu mới của trường đại học Tây Ontario, Canada, các nhà khoa học đã mở ra hướng đi mới chống lại vi khuẩn kháng kháng sinh, đó là sử dụng CRISPR-Cas9 để tấn công trực tiếp một hoặc nhiều loại vi khuẩn mà con người mong muốn. Cơn ác mộng kháng thuốc kháng sinh có thể sẽ đi đến hồi kết.

tai-sao-khong-co-sinh-vat-ba-chan-nao-tren-trai-dat

Khám Phá - Tại Sao Không Có Sinh Vật Ba Chân Nào Trên Trái Đất?

07 Tháng Mười 2019

Khoa học trả lời những câu hỏi "Tại sao?" và cả "Tại sao không?". Thỉnh thoảng, các nhà khoa học sẽ thấy đáng giá bỏ công tìm hiểu tại sao có những thứ không bao giờ tồn tại: chẳng hạn như một sinh vật có ba chân.

y-hoc-nguoi-liet-toan-than-di-lai-binh-thuong

Y Học - Người Liệt Toàn Thân Đi Lại Bình Thường Nhờ Bộ Khung Xương Điều Khiển Bằng Suy Nghĩ

07 Tháng Mười 2019

Khoảng đầu tháng 10/2019, một nhóm nghiên cứu tại Pháp đã thành công trong việc giúp 1 người bị chấn thương tủy sống dẫn đến liệt tứ chi có thể đi lại được nhờ việc cấy vào não họ 1 thiết bị giúp điều khiển 1 bộ khung trợ lực để hỗ trợ di chuyển.

tai-sao-nguoi-dan-trung-khanh-van-vui-ve

Tại Sao Người Dân Trùng Khánh Vẫn Vui Vẻ Dù Đây Là Thành Phố Nhiều Camera Theo Dõi Nhất Thế Giới?

07 Tháng Mười 2019

Sau một ca làm việc dài và mệt mỏi, Wu Fuchun, một người lái taxi 33 tuổi mải miết đi tìm nhà vệ sinh. Năm phút sau, một tin nhắn hiện lên trên điện thoại của Wu, nói rằng chiếc xe của anh đã đỗ sai vị trí, vi phạm luật giao thông. Tiếp theo là ba điểm phạt trong giấy phép lái xe và tài khoản trừ 200 nhân dân tệ (khoảng 28 USD).