Google Phát Hành Bộ API Nhận Diện Đối Tượng TensorFlow

19 Tháng Sáu 20178:00 CH(Xem: 19510)
Google Phát Hành Bộ API Nhận Diện Đối Tượng TensorFlow
Google Phát Hành Bộ API Nhận Diện Đối Tượng TensorFlow
Khoảng giữa tháng 06/2017, Google đã phát hành bộ API nhận diện đối tượng TensorFlow mới của hãng, giúp các nhà phát triển và các nhà nghiên cứu dễ dàng xác định các đối tượng trong những hình ảnh hơn. Google đang cố gắng cung cấp chúng một cách đơn giản và hiệu năng cao nhất có thể, các mô hình vừa được phát hành có hiệu năng rất tốt và đang được sử dụng thường xuyên trong nghiên cứu.

Các mô hình có bộ API nhận diện với những mạng lưới thần kinh nhân tạo dạng xoắn nặng nề và các mô hình tinh gọn được thiết kế để hoạt động trên những cỗ máy ít phức tạp hơn, bộ dò đơn MobileNets được tối ưu để có thể chạy trên thiết bị di động theo thời gian thực.

Trong tháng 06/2017, Google cũng đã ra mắt một loạt mô hình thị giác MobileNets cho các máy tính cấu hình thấp. Các mô hình có thể xử lý các tác vụ như nhận diện đối tượng, nhận diện gương mặt và nhận diện các cột mốc vị trí trong không gian.

Thế hệ smartphone hiện nay đều không có những tài nguyên điện toán như những chiếc máy tính để bàn hay các thiết bị máy chủ, nên các nhà phát triển chỉ còn 2 lựa chọn: dựa vào các mô hình máy học chạy trên đám mây nhưng sẽ làm gia tăng độ trễ, và đòi hỏi phải có kết nối Internet, lựa chọn này khó có thể áp dụng trong nhiều trường hợp sử dụng thông thường. Hoặc đơn giản hóa bản thân các mô hình để có thể triển khai được ở nhiều nơi hơn.

Google, Facebook và Apple đang tập trung vào các mô hình di động thứ 2. Mùa thu 2016, Facebook giới thiệu khung chương trình Caffe2Go để xây dựng các mô hình có thể chạy trên smartphone, bước triển khai lớn đầu tiên của framework chính là bộ lọc hình ảnh dựa trên kỹ thuật Style Transfer của Facebook.

Ngoài ra, tại hội nghị nhà phát triển I/O 2017, Google cũng đã phát hành TensorFlow Lite, một phiên bản của khung chương trình máy học tinh gọn. Apple cũng giới thiệu CoreML, nỗ lực trong việc giảm mức độ phức tạp của các mô hình máy học đang chạy trên những thiết bị iOS. Trong khi đó, các dịch vụ đám mây công cộng của Google giúp hãng có vị thế khác biệt hơn so với cả Facebook và Apple. Google từ lâu cũng đã giới thiệu các dịch vụ tầm nhìn máy tính trên quy mô lớn thông qua bộ API Cloud Vision.
521Vote
414Vote
35Vote
218Vote
16Vote
3.464
Gửi ý kiến của bạn
Tắt
Telex
VNI
Tên của bạn
Email của bạn
Tạo bài viết
04 Tháng Mười Một 2019
Tập đoàn dầu lửa quốc doanh Saudi Aramco có thể trị giá 1.5 nghìn tỷ USD hoặc ít hơn một chút sau khi IPO theo tính toán của các chuyên gia phân tích.
04 Tháng Mười Một 2019
Khoảng đầu tháng 11/2019, Microsoft ra mắt logo mới của Edge, trình duyệt dựa trên nền tảng Chromium sẽ thay thế hoàn toàn cho Internet Explorer.
04 Tháng Mười Một 2019
Khoảng đầu tháng 11/2019, tổng giám đốc (CEO) Steve Easterbrook của McDonald’s bất ngờ mất toàn bộ các chức vụ tại hãng đồ ăn nhanh sau khi Hội đồng Quản trị xác định ông vi phạm chính sách của công ty.
04 Tháng Mười Một 2019
Các ngôi sao đang chiến đấu với khí và bụi trong Tinh Vân Đầm Phá (Lagoon Nebula) nhưng giành chiến thắng lại là các nhiếp ảnh gia.
04 Tháng Mười Một 2019
Mô hình thử nghiệm khí động học của oanh tạc cơ H-20 có hình dáng giống B-2 Mỹ, khiến nhiều người nghi ngờ Trung Quốc sao chép thiết kế.
03 Tháng Mười Một 2019
Khoảng đầu tháng 11/2019, Chính phủ Mỹ đang mở cuộc điều tra nhằm vào TikTok với mối quan ngại về an ninh quốc gia. TikTok là nền tảng mạng xã hội sở hữu bởi ByteDance, Trung Quốc và nó sớm trở nên nổi phổ biến trong giới trẻ Mỹ và thế giới nhờ các video ngắn vui nhộn được người dùng chia sẻ.