Công Nghệ Máy Học Đã Có Thể Tự Tập Hợp Kiến Thức Bằng Cách Lướt Web Tìm Kiếm Thông Tin

15 Tháng Mười Một 201611:00 CH(Xem: 21900)
Công Nghệ Máy Học Đã Có Thể Tự Tập Hợp Kiến Thức Bằng Cách Lướt Web Tìm Kiếm Thông Tin
blank
Trung tuần tháng 11/2016, công nghệ máy học (machine-learning) đã có bước tiến đột phá mới. Nhóm nghiên cứu sinh tại Học viện Công nghệ Massachusetts đã thành công trong việc “dạy” những cỗ máy machine-learning cách “tra thông tin trên Google”

Trong năm 2016, tồn tại vấn đề với dữ liệu – nhưng nó khác xa với thứ mà con người từng trải qua trong nhiều thập kỷ trước. Thay vì bị thiếu thốn về mặt thông tin, rắc rối mà người dùng gặp phải hiện nay chính là việc có quá nhiều thông tin và “nhồi nhét” chúng vào một chỗ để quản lý là việc cần thiết.

Các nhà nghiên cứu từ Học viện Công nghệ Massachusetts đã đặt ra mục tiêu để giải quyết thử thách bằng một hệ thống AI mới – thứ đã đạt được giải nhất của hạng mục Phương pháp thực nghiệm Xử lý Ngôn ngữ Tự nhiên tại Hội nghị Liên hiệp Ngôn ngữ Máy tính được tổ chức vào tháng 11/2016. Hệ thống mới thay đổi hoàn toàn những kỹ thuật máy học bằng cách đưa ra một phương thức tiếp nhận thông tin mới, cho phép một trí thông minh nhân tạo biến những đoạn chữ thành dữ liệu để phân tích, thống kê và cải thiện khả năng hoạt động bằng cách “lướt” web tìm thông tin.

Karthik Narasimhan, học viên đang theo học tại khoa Kỹ thuật Điện và Khoa học máy tính tại trường MIT, chia sẻ với trang Digital Trends: “Phương pháp này tương tự với cách con người chúng ta tìm kiếm thông tin. Ví dụ, nếu tôi tìm thấy một bài viết với những dẫn chứng mà tôi không hiểu, tôi biết rằng để hiểu được nó, mình cần phải luyện tập nhiều hơn. Vì có quyền truy cập vào các bài viết khác có cùng chủ đề, tôi sẽ tra cứu trên mạng để lấy thêm thông tin từ nhiều nguồn khác nhau, từ đó mà nhận thức được vấn đề. Chúng tôi muốn làm điều tương tự với máy móc.”

Cơ chế hoạt động của hệ thống máy học thuộc MIT là đánh giá, so sánh độ giống nhau của thông tin. Nếu nó nhận định mình không “tự tin” vào một kiến thức nào đó, nó có thể tự động thực hiện tra cứu trên mạng để tìm kiếm những thông tin nhằm điền vào chỗ trống. Nếu nó đưa ra kết luận rằng một tài liệu cụ thể không có sự tương quan, nó sẽ chuyển sang tài liệu khác. Cuối cùng, nó sẽ tiếp nhận tất cả những “mảnh ghép” thông tin chính xác nhất và “chắp nối” chúng vào với nhau.

Nhóm nghiên cứu sinh tại MIT đã “huấn luyện” hệ thống máy học bằng cách yêu cầu nó sắp xếp, thu nhập thông tin về những vụ xả súng lớn tại Mỹ, dựa trên những nghiên cứu về ảnh hưởng của việc kiểm soát súng đạn và ngộ độc thức ăn. Cỗ máy được hướng dẫn tìm kiếm thông tin trong số 300 tài liệu, hồ sơ bằng cách trả lời một số câu hỏi và nó đã hoàn thành nhiệm vụ được giao.

Karthik Narasimhan cho biết: “Chúng tôi sử dụng một kỹ thuật gọi là Reinforcement Learning (học tăng cường), là cách mà hệ thống sẽ học theo phương thức ‘khoản thưởng’. Vì có rất nhiều lỗ hổng trong những dữ liệu được thu thập – đặc biệt khi có các thông tin mâu thuẫn lẫn nhau – chúng tôi cho nó ‘khoản thưởng’ dựa trên sự chính xác của tài liệu. Bằng cách thực hiện điều này đối với những thông tin chúng tôi cung cấp cho nó khi luyện tập, hệ thống sẽ học cách có thể liên kết những dự đoán một cách tốt nhất, để chúng tôi có thể tìm được câu trả lời chính xác đang tìm kiếm.”

Hệ thống máy học thông minh có thể được ứng dụng trong ngành Y. Karthik Narasimhan chia sẻ: “Đây sẽ là một công cụ tuyệt vời để tập hợp lại được tiền sử bệnh lý của bệnh nhân. Trong những trường hợp nhiều bác sĩ viết về các phương pháp chữa trị khác nhau cho một bệnh nhân – mỗi người viết một cách về nó – công nghệ có thể sử dụng để lọc các thông tin đó để đưa vào cơ sở dữ liệu. Kết quả thu được là những bác sĩ có thể đưa ra những quyết định, chẩn đoán sáng suốt hơn về bệnh nhân.”
52Vote
40Vote
31Vote
22Vote
14Vote
2.39
Gửi ý kiến của bạn
Tắt
Telex
VNI
Tên của bạn
Email của bạn
Tạo bài viết
15 Tháng Chín 2019
Khoảng giữa tháng 09/2019, Google cho biết đang thay đổi thuật toán tìm kiếm của hãng một lần nữa. Theo thông báo, thuật toán tìm kiếm mới sẽ nhấn mạnh hơn vào "các tin báo cáo gốc" khi chúng sẽ được xếp hạng cao hơn trong các kết quả tìm kiếm. Để chuẩn, công ty đã phân phát các chỉ dẫn cho bộ khung thuật toán đến hơn 10,000 reviewer con người, để nhận được phản hồi về kết quả xếp hạng thật sự.
15 Tháng Chín 2019
Khoảng giữa tháng 09/2019, sau lệnh cấm tạm thời không cho phép Kasptersky Lab cung cấp phần mềm và giải pháp bảo mật cho các cơ quan chính phủ Mỹ, một lệnh cấm chính thức đã được đưa ra.
13 Tháng Chín 2019
Khoảng giữa tháng 09/2019, xe hơi điện E của Honda đã chính thức được giới thiệu, và phiên bản sản xuất của nó vẫn lưu giữ được gần như toàn bộ những đặc điểm lẫn tính năng của bản concept ban đầu. Honda cũng đã tiết lộ giá bán và thông số của chiếc xe hơi điện dành cho đô thị.
13 Tháng Chín 2019
Khoảng giữa tháng 09/2019, sau vài năm tranh chấp với thuế vụ nước Pháp, Google đã phải thỏa thuận dàn xếp để chấm dứt cuộc điều tra gian lận thuế. Tổng cộng, Google phải trả 1.059 tỷ USD, trong đó, 510 triệu USD tiền thuế mà Google đã trốn trong khoảng thời gian từ năm 2005 đến năm 2018, và 549 triệu USD tiền phạt cho chính phủ Pháp.
13 Tháng Chín 2019
Khoảng giữa tháng 09/2019, tuyên bố mới về thảm họa nhà máy điện hạt nhân Fukushima của bộ trưởng môi trường Nhật Bản đang khiến những ngư dân và các tổ chức về môi trường phẫn nộ.
13 Tháng Chín 2019
Để xử lý cả một đoạn văn, ta sẽ phải gõ lại tất cả, thậm chí là copy – paste từng ký tự từ chỗ này sang chỗ khác. Đây cũng chính là hạn chế mà các nhà sinh học phải đối mặt trong nhiều thập kỷ. Với những công cụ chỉnh sửa gen hiện đại nhất, kể cả CRISPR, từ trước tới nay họ cũng chỉ mới thao tác được với từng gen hoặc đoạn gen rất ngắn nội trong từng tế bào.