Thị giác máy tính là gì? Sự phát triển và ứng dụng trong IoT

Thị giác máy tính chuẩn bị cách mạng hóa IoT.

0

Sự phát triển của thị giác máy tính

Bạn có thể dễ dàng tìm thấy công nghệ thị giác máy tính trong các sản phẩm hàng ngày, từ máy chơi game có thể nhận ra cử chỉ của bạn đến máy ảnh điện thoại di động có thể tự động tập trung vào mọi người. Nó đang tác động đến nhiều lĩnh vực trong cuộc sống của chúng ta.

Trên thực tế, thị giác máy tính có một lịch sử lâu dài trong các ứng dụng thương mại và chính phủ. Các cảm biến quang học có thể cảm nhận sóng ánh sáng trong các phạm vi phổ khác nhau được triển khai trong nhiều ứng dụng: Giống như đảm bảo chất lượng trong sản xuất, viễn thám để quản lý môi trường hoặc camera độ phân giải cao thu thập thông tin tình báo trên chiến trường. Một số cảm biến này đứng yên trong khi một số khác được gắn vào các vật thể chuyển động, chẳng hạn như vệ tinh, máy bay không người lái và phương tiện.

Trước đây, nhiều ứng dụng thị giác máy tính này chỉ giới hạn ở một số nền tảng đóng. Nhưng khi kết hợp với các công nghệ kết nối IP, chúng tạo ra một bộ ứng dụng mới mà trước đây không thể có. Thị giác máy tính, kết hợp với kết nối IP, phân tích dữ liệu tiên tiến và trí tuệ nhân tạo, sẽ là các chất xúc tác cho nhau, tạo ra bước nhảy vọt mang tính cách mạng trong đổi mới và ứng dụng Internet vạn vật (IoT).

Những tiến bộ trong nhiều lĩnh vực điều khiển thị giác máy tính

Môi trường được thiết kế cho thị giác

Thị giác là giác quan phát triển nhất trong năm loại của con người. Chúng ta sử dụng nó hàng ngày để nhận ra bạn bè, phát hiện những trở ngại trên con đường của chúng tôi, để hoàn thành nhiệm vụ và học hỏi những điều mới. Chúng ta thiết kế môi trường vật lý phục vụ thị giác. Có biển báo và đèn tín hiệu để giúp chúng ta đi từ nơi này đến nơi khác. Cửa hàng có dấu hiệu để giúp chúng ta xác định vị trí chúng. Màn hình máy tính và truyền hình hiển thị thông tin và giải trí mà chúng ta tiêu thụ. Với tầm quan trọng của thị giác, nó không phải là một bước nhảy vọt để mở rộng sang máy tính và tự động hóa.

Thị giác máy tính là gì?

Thị giác máy tính bắt đầu với công nghệ chụp và lưu trữ một hình ảnh, hoặc bộ hình ảnh, sau đó biến những hình ảnh đó thành thông tin có thể được tiếp tục hành động. Nó bao gồm một số công nghệ làm việc cùng nhau (Hình 1). Kỹ thuật thị giác máy tính là một lĩnh vực liên ngành đòi hỏi phải có chức năng chéo và chuyên môn hệ thống trong một số các công nghệ này.

Ví dụ, Microsoft Kinect sử dụng thuật toán đồ họa máy tính 3D để cho phép thị giác máy tính phân tích và hiểu các cảnh ba chiều. Nó cho phép các nhà phát triển trò chơi hợp nhất ảnh chụp chuyển động toàn thân theo thời gian thực với môi trường 3D nhân tạo. Bên cạnh lĩnh vực về game, điều này mở ra những khả năng mới trong các lĩnh vực như robot, thực tế ảo (VR) và các ứng dụng thực tế tăng cường (AR).

Cải tiến công nghệ cảm biến cũng đang diễn ra nhanh chóng ở nhiều cấp độ vượt qua cảm biến máy ảnh thông thường. Một số ví dụ gần đây bao gồm:\

  • Cảm biến hồng ngoại và laser kết hợp với nhau để cảm nhận độ sâu và khoảng cách, là một trong những yếu tố quyết định quan trọng của xe tự lái và ứng dụng bản đồ 3D
  • Cảm biến không xâm lấn theo dõi các dấu hiệu quan trọng của bệnh nhân y tế mà không cần tiếp xúc vật lý
  • Máy ảnh tần số cao có thể ghi lại những chuyển động tinh tế mà mắt người không thể nhận ra để giúp vận động viên phân tích dáng đi của họ
  • Cảm biến thị giác với nguồn cực thấp và chi phí thấp có thể được triển khai ở bất cứ đâu trong một thời gian dài

Ảnh 1. Thị giác máy tính được thúc đẩy bởi những tiến bộ trong nhiều lĩnh vực. Nguồn: IFA

Thị giác máy tính trở nên thông minh

Những ứng dụng đầu tiên

Ngành công nghiệp giám sát là một trong những đối tượng đầu tiên áp dụng các kỹ thuật xử lý hình ảnh và phân tích video. Phân tích video là trường hợp sử dụng đặc biệt của thị giác máy tính tập trung vào việc tìm kiếm các mẫu từ nhiều giờ quay video. Khả năng tự động phát hiện và xác định các mẫu được xác định trước trong các tình huống trong thế giới thực thể hiện cơ hội thị trường lớn với hàng trăm trường hợp sử dụng.

Các công cụ phân tích video đầu tiên sử dụng các thuật toán thủ công xác định các tính năng cụ thể trong hình ảnh và video. Họ chính xác trong môi trường phòng thí nghiệm và môi trường mô phỏng. Tuy nhiên, hiệu suất nhanh chóng giảm xuống khi dữ liệu đầu vào, như điều kiện ánh sáng và chế độ xem camera, lệch khỏi các giả định khi thiết kế.

Các nhà nghiên cứu và kỹ sư đã dành nhiều năm để phát triển và điều chỉnh các thuật toán hoặc đến với các thuật toán mới để đối phó với các điều kiện khác nhau. Tuy nhiên, máy ảnh hoặc máy quay video sử dụng các thuật toán đó vẫn chưa đủ mạnh. Mặc dù có một số tiến bộ gia tăng trong những năm qua, hiệu suất thế giới thực kém đã hạn chế tính hữu dụng và áp dụng công nghệ.

Đột phá học sâu

Trong những năm gần đây, sự xuất hiện của các thuật toán học sâu đã tái sinh thị giác máy tính. Học sâu sử dụng thuật toán Mạng thần kinh nhân tạo (ANN) mô phỏng các tế bào thần kinh của não người.

Bắt đầu từ đầu những năm 2010, hiệu suất máy tính, được tăng tốc bởi các đơn vị xử lý đồ họa (GPU), đã phát triển đủ mạnh để các nhà nghiên cứu nhận ra khả năng của mạng ANN phức tạp. Bên cạnh đó, một phần được thúc đẩy bởi các trang web video và các thiết bị IoT phổ biến, các nhà nghiên cứu có các thư viện dữ liệu hình ảnh và video đa dạng lớn để đào tạo mạng lưới Neural của họ.

Vào năm 2012, một phiên bản của Mạng lưới thần kinh sâu (DNN), được gọi là Mạng thần kinh chuyển đổi (CNN), đã chứng minh một bước nhảy vọt lớn về độ chính xác. Sự phát triển đó đã thúc đẩy sự quan tâm và hứng thú mới trong lĩnh vực kỹ thuật thị giác máy tính. Giờ đây, trong các ứng dụng yêu cầu phân loại hình ảnh và nhận dạng khuôn mặt, các thuật toán học sâu thậm chí còn vượt xa các đối tác của con người. Quan trọng hơn, giống như con người, các thuật toán này có khả năng học hỏi và thích nghi với các điều kiện khác nhau.

Ảnh 2. Sơ đồ mô tả phân tích cảnh

Với việc học sâu, chúng ta đang bước vào kỷ nguyên công nghệ nhận thức, nơi thị giác máy tính và học sâu tích hợp để giải quyết các vấn đề phức tạp, cấp độ cao từng là chuyên môn của bộ não con người (Hình 2). Chúng tôi chỉ đang nhìn trên bề mặt của những gì có thể. Các hệ thống này sẽ tiếp tục cải tiến với bộ xử lý nhanh hơn, thuật toán học máy tiên tiến hơn và tích hợp sâu hơn vào các thiết bị edge. Tầm nhìn máy tính được thiết lập để cách mạng hóa IoT. 

Ngày càng được áp dụng

Các trường hợp sử dụng thú vị khác bao gồm:

Ảnh 3. Chỉ số thực vật từ hình ảnh thu thập được từ drone (Nguồn: www.emmetts.com.au)

Đây chỉ là một số ví dụ nhỏ về cách thị giác máy tính có thể tăng năng suất trong nhiều lĩnh vực. Chúng tôi đang bước vào giai đoạn phát triển tiếp theo của IoT. Trong giai đoạn đầu tiên, chúng tôi tập trung vào việc kết nối các thiết bị, tổng hợp dữ liệu và xây dựng các nền tảng dữ liệu lớn. Trong giai đoạn thứ hai, trọng tâm sẽ chuyển sang làm cho những thứ khác trở nên thông minh hơn thông qua các công nghệ như tầm nhìn máy tính và học sâu, tạo ra nhiều dữ liệu hành động hơn.

Thử thách

Có nhiều vấn đề cần khắc phục trong việc làm cho công nghệ trở nên thiết thực và tiết kiệm hơn cho công chúng:

  • Nền tảng nhúng cần tích hợp thiết kế thần kinh sâu. Có những quyết định thiết kế khó khăn được đưa ra xung quanh mức tiêu thụ điện năng, chi phí, độ chính xác và tính linh hoạt.
  • Ngành công nghiệp cần tiêu chuẩn hóa để cho phép các thiết bị và hệ thống thông minh giao tiếp với nhau và chia sẻ siêu dữ liệu
  • Hệ thống không còn là người thu thập dữ liệu thụ động. Họ cần hành động dựa trên dữ liệu với sự can thiệp tối thiểu của con người. Họ cần phải tự học và ứng biến. Toàn bộ quá trình cập nhật software/firmware có ý nghĩa mới trong kỷ nguyên học máy.
  • Tin tặc có thể khai thác các lỗ hổng bảo mật mới trong thị giác máy tính và AI. Nhà thiết kế cần phải tính đến điều đó.

Kết luận

Trong bài đăng này, chúng tôi đã giới thiệu ngắn gọn về thị giác máy tính và làm thế nào nó trở thành một thành phần quan trọng của nhiều thiết bị và ứng dụng được kết nối. Trên hết, chúng tôi dự đoán sự tăng trưởng bùng nổ sắp xảy ra của nó và liệt kê một số trở ngại trong các ứng dụng thực tế. Trong loạt bài viết tiếp theo, chúng tôi sẽ khám phá các khuôn khổ mới, thực tiễn tốt nhất và phương pháp thiết kế để vượt qua một số thách thức.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây