Khoảng giữa tháng 06/2017, Google đã phát hành bộ API nhận diện đối tượng TensorFlow mới của hãng, giúp các nhà phát triển và các nhà nghiên cứu dễ dàng xác định các đối tượng trong những hình ảnh hơn. Google đang cố gắng cung cấp chúng một cách đơn giản và hiệu năng cao nhất có thể, các mô hình vừa được phát hành có hiệu năng rất tốt và đang được sử dụng thường xuyên trong nghiên cứu.
Các mô hình có bộ API nhận diện với những mạng lưới thần kinh nhân tạo dạng xoắn nặng nề và các mô hình tinh gọn được thiết kế để hoạt động trên những cỗ máy ít phức tạp hơn, bộ dò đơn MobileNets được tối ưu để có thể chạy trên thiết bị di động theo thời gian thực.
Trong tháng 06/2017, Google cũng đã ra mắt một loạt mô hình thị giác MobileNets cho các máy tính cấu hình thấp. Các mô hình có thể xử lý các tác vụ như nhận diện đối tượng, nhận diện gương mặt và nhận diện các cột mốc vị trí trong không gian.
Thế hệ smartphone hiện nay đều không có những tài nguyên điện toán như những chiếc máy tính để bàn hay các thiết bị máy chủ, nên các nhà phát triển chỉ còn 2 lựa chọn: dựa vào các mô hình máy học chạy trên đám mây nhưng sẽ làm gia tăng độ trễ, và đòi hỏi phải có kết nối Internet, lựa chọn này khó có thể áp dụng trong nhiều trường hợp sử dụng thông thường. Hoặc đơn giản hóa bản thân các mô hình để có thể triển khai được ở nhiều nơi hơn.
Google, Facebook và Apple đang tập trung vào các mô hình di động thứ 2. Mùa thu 2016, Facebook giới thiệu khung chương trình Caffe2Go để xây dựng các mô hình có thể chạy trên smartphone, bước triển khai lớn đầu tiên của framework chính là bộ lọc hình ảnh dựa trên kỹ thuật Style Transfer của Facebook.
Ngoài ra, tại hội nghị nhà phát triển I/O 2017, Google cũng đã phát hành TensorFlow Lite, một phiên bản của khung chương trình máy học tinh gọn. Apple cũng giới thiệu CoreML, nỗ lực trong việc giảm mức độ phức tạp của các mô hình máy học đang chạy trên những thiết bị iOS. Trong khi đó, các dịch vụ đám mây công cộng của Google giúp hãng có vị thế khác biệt hơn so với cả Facebook và Apple. Google từ lâu cũng đã giới thiệu các dịch vụ tầm nhìn máy tính trên quy mô lớn thông qua bộ API Cloud Vision.
- Từ khóa :
- ,
- TensorFlow
- ,
- API
Gửi ý kiến của bạn