Đại Học Cambridge Dạy Robot, Xe “Nhìn Thấy” Giống Như Con Người

26 Tháng Mười Hai 20158:00 CH(Xem: 16900)

Một trong những điều khó khăn nhất trong việc dạy máy móc là: làm thế nào để nó có thể nhìn thấy. Phần cứng của máy móc hiện nay chưa thể giải quyết được vấn đề, vì nó đòi hỏi khả năng nhận diện, phân loại và sử dụng các đối tượng.

Tuy nhiên, hạ tuần tháng 12/2015, các nhà nghiên cứu thuộc Đại học Cambridge đã phát triển hai công nghệ mới có thể mang đến khả năng nhìn thấy thực sự cho các robot, dựa trên công nghệ deep learning.

Theo đó, các nhà nghiên cứu đang tập trung để mang những công nghệ mới đưa vào sử dụng cho xe tự lái. Ngoài ra, công nghệ mới còn khá hữu ích cho công nghệ tăng cường thực tế ảo augmented reality, hay các loại camera giám sát. Hai công nghệ mới được gọi là SegNet và một hệ thống chưa được đặt tên.

SegNet là ứng dụng nhận dạng trong thời gian thực, có thể nhận diện các đối tượng chính xác hơn cả các hệ thống radar tiên tiến nhất trên xe ô tô bán tự hành hiện nay. Cụ thể, nó có thể xác định nội dung hình ảnh quét được, và phân loại các vật thể trong ảnh thành 12 loại khác nhau, chẳng hạn như đường đi, biển báo, người đi bộ, các tòa nhà,...

Hệ thống sẽ hoạt động trong gần như tất cả điều kiện ánh sáng, bao gồm cả ban đêm, và nhận diện hình ảnh theo thời gian thực. Mặc dù hướng đến môi trường đô thị, SegNet cũng có khả năng nhận diện các vật thể ở vùng nông thôn, và trong các điều kiện thời tiết khác nhau, nhờ vào công nghệ deep learning.

Alex Kendall, một nghiên cứu sinh thuộc Khoa Kỹ thuật cho biết: “Hệ thống nhận biết vật thể trong hình ảnh rất tốt vì nó trải qua rất nhiều cuộc luyện tập. Tuy nhiên, còn rất nhiều việc phải làm để khiến nó tốt hơn nữa”.

Được biết, hệ thống đã được "đào tạo" bởi các nghiên cứu sinh với hơn 5,000 hình ảnh đường phố khác nhau. Mỗi điểm ảnh trong hình đều được phân loại và đánh dấu vật thể để hệ thống tham khảo. Từ đó, SegNet sẽ "học" cách nhận ra những vật thể đó theo thời gian, dần dần nó sẽ có thể nhận diện hình ảnh mà không cần có đánh dấu.

Đi cùng với Segnet là hệ thống nhận diện địa điểm qua những gì nó nhìn thấy trong camera. Hệ thống này chính xác hơn nhiều so với GPS, và sẽ hoạt động ở bất kỳ môi trường nào có camera, chẳng hạn như trong nhà, hoặc kể cả trong các điều kiện thiếu sáng như đường hầm,...

Hiện hệ thống có thể xác định được vị trí của camera trong hoặc ngoài toà nhà một cách chính xác. Được biết, ban đầu nó sẽ được sử dụng trên các robot; trong tương lai sẽ là xe tự lái và các thiết bị đeo thông minh.

Thông tin chi tiết về cả 2 công nghệ mới sẽ được trình bày tại Hội nghị quốc tế International Conference on Computer Vision ở Chile.

56Vote

41Vote

38Vote

25Vote

14Vote

324