Cách AI và thị giác máy tính tăng tốc tự động hóa trong công việc .

Công nghệ thị giác máy tính tiên tiến hoàn toàn có thể phá vỡ thị trường cho các công việc có trình độ thấp và giới thiệu công nghệ tự động hóa trước đây chưa được biết đến.

0

Mạng lưới Neural Networks cho thấy kết quả ấn tượng khi làm việc với dữ liệu hình ảnh. Ngày nay, công nghệ được phát triển tốt có thể thực hiện toàn diện hơn bộ não của con người khi phân loại hàng triệu hình ảnh hoặc nhận dạng các mẫu trong ảnh được chụp bởi kính viễn vọng Kepler. Do đó, phân tích và xử lý hình ảnh được hỗ trợ bởi AI đã tiến đến các khu vực đa dạng, vượt xa nhiếp ảnh hoặc phương tiện truyền thông xã hội.

EBay đã ra mắt tính năng thị giác máy tính cho phép tìm kiếm sản phẩm bằng hình ảnh thay vì từ khóa hoặc mô tả. Chọn mục “Tìm kiếm hình ảnh”, khách hàng có thể chỉ cần chụp ảnh sản phẩm và sử dụng nó để tìm một sản phẩm tương tự trên thị trường.

Trong chăm sóc sức khỏe, việc sử dụng mạng Neural Networks hứa hẹn sẽ tăng cường nghiêm túc khả năng chẩn đoán. Ngày nay, các mạng lưới thần kinh đã thực hiện phân loại ung thư da và có thể xác định khối u ác tính với độ chính xác 90%.

Và sau đó phải kể đến các ứng dụng trong an ninh quốc gia. Gần đây, các cơ quan hành pháp của Hoa Kỳ đã tập trung vào Amazon Rekognition để nhắm vào các tội phạm bị nghi ngờ. Hệ thống nhận dạng khuôn mặt tiên tiến này không chỉ theo dõi con người trong thời gian thực mà còn gợi ý tuổi tác và trạng thái cảm xúc của họ.

Khi các mạng lưới Neural Networks thể hiện sự hoàn thiện trong các lĩnh vực khác nhau, nhiều thương hiệu nhìn vào tiềm năng của dữ liệu hình ảnh để tìm hiểu cách tích hợp lợi thế này vào các chiến lược chuyển đổi kỹ thuật số của họ.

Dưới đây là các cơ hội chính của việc sử dụng mạng Neural Networks trong dữ liệu hình ảnh mà các doanh nghiệp có thể xem xét:

Cải thiện việc nhắm mục tiêu và cá nhân hóa

Các công ty B2C không ngừng tìm kiếm các cách để đến gần hơn với khách hàng và hình dung ra những mong muốn và mục tiêu của họ. Nhờ các phương tiện truyền thông xã hội và nền tảng đánh giá khách hàng, nó dễ dàng tìm hiểu những gì mọi người nói về sản phẩm và dịch vụ, nhưng không phải những gì họ thấy hoặc hiển thị.

Thị giác máy tính có thể mở rộng tầm nhìn của thương hiệu tới khách hàng của họ. Sử dụng hình ảnh, các công ty có thể có được một bức tranh tốt hơn về sở thích của mọi người. Do đó, những người học cách rút ra được những hiểu biết sâu từ dữ liệu này sẽ đi trước đối thủ.

Startup Shoto là một trong những người đầu tiên nhận ra cơ hội này. Công ty đã đào tạo các mạng lưới Neural Networks để hiểu những bức ảnh mọi người chụp tại các sự kiện tương tự và cho phép người tham dự trao đổi những bức ảnh này trên cơ sở mạng peer-to-peer.

Đầu tiên, nó cải thiện sự tham gia của khách hàng và chắc chắn tăng cường độ phủ sóng trên phương tiện truyền thông xã hội. Tuy nhiên, đây không phải là một viên đá quý thực thụ. Cuối cùng, công ty nhận được những hiểu biết độc đáo về chính sự kiện này – phiên nào là phổ biến nhất, diễn giả chính nào thu hút phần lớn khán giả, ai có được sự quan tâm của những người tham gia trực tuyến. Thông tin này cho phép họ đưa ra quyết định dựa trên dữ liệu về sự kiện tiếp theo, cá nhân hóa các phiên cho một số đối tượng nhất định và nhắm mục tiêu vào người tham dự phù hợp hơn.

Tăng phạm vi tiếp cận và mở rộng lên đến nhiều kênh

Một khi các mạng Neural Networks hiểu nội dung hình ảnh, họ có thể chuyển đổi nó thành bất kỳ hình thức giao tiếp nào. Nói cách khác, họ có thể viết nó ra hoặc nói ra, ví dụ, bằng cách sử dụng các trợ lý giọng nói phổ biến. Điều này có nghĩa là phạm vi tiếp cận của nội dung hình ảnh mở rộng hơn, tùy thuộc vào mục đích.

Facebook bắt đầu dịch hình ảnh thành lời nói để cải thiện trải nghiệm của khách hàng cho người mù. Công ty đã tạo ra công nghệ thị giác máy tính để có thể chuyển đổi nội dung hình ảnh thành văn bản thay thế và sau đó nói với mọi người bằng tiếng Anh những gì có trong hình ảnh bằng cách sử dụng các cụm từ đơn giản như “ngoài trời, người cười, chó con.”

ABBYY đã tiến lên một bước và kích hoạt nhận dạng văn bản trong các bức ảnh được chụp bằng camera trên một chiếc điện thoại thông minh thông thường và dịch tức thời cả ở chế độ trực tuyến và ngoại tuyến. TextGrabber ngoại tuyến hiểu văn bản được viết bằng 10 ngôn ngữ phổ biến. Chế độ trực tuyến chia tỷ lệ lên tới 62 nguồn và 104 ngôn ngữ chiến lược được dịch theo thời gian thực.

Tự động hóa các quy trình, nâng cao hiệu quả và độ chính xác

Tận dụng dữ liệu hình ảnh có thể thực sự nâng cao trải nghiệm của khách hàng và giúp các thương hiệu tương tác lại với khách hàng của họ bằng cách sử dụng các kênh mới và hiện có.

Tuy nhiên, đối với một số công ty, dữ liệu hình ảnh là cốt lõi của các hoạt động mà cho đến gần đây chỉ được thực hiện thủ công. Ngày nay, nhờ phân tích và xử lý hình ảnh thông minh, các hoạt động này có thể có hiệu quả hơn nhiều.

Đầu tiên, thị giác máy tính có thể tự động hóa các quy trình giấy tờ đòi hỏi đưa ra các quyết định đơn giản, ví dụ, sao chép dữ liệu từ các biểu mẫu giấy sang các nguồn trực tuyến.

Ngân hàng Receipt Bank sử dụng công nghệ Fintech đã xây dựng một hệ thống nhắm mục tiêu các hoạt động kế toán và quản lý sổ sách trên các doanh nghiệp khác nhau và cho phép tự động hóa các thủ tục giấy tờ bằng cách sử dụng thị giác máy tính. Hệ thống phân tích hình ảnh của các hóa đơn và biên lai, trích xuất thông tin quan trọng từ dữ liệu hình ảnh này và tải nó lên phần mềm của khách hàng. Do đó, Ngân hàng Receipt Bank cho phép bạn tự động hóa hoàn toàn các công việc thường xuyên nặng về nhân lực, nâng cao hiệu quả và thậm chí giảm các sai lệch và sự không chính xác.

Thứ hai, các giải pháp để hiểu dữ liệu trực quan có thể tạo ra tác động đối với các hoạt động phức tạp hơn yêu cầu trí óc con người. Gần đây, Google DeepMind đã tạo ra hệ thống có thể kết xuất các đối tượng 3D từ hình ảnh 2D. Nói cách khác, DeepMind đã đào tạo các mạng lưới Neural Networks để tưởng tượng không gian từ các góc độ khác nhau và xây dựng một môi trường ba chiều mà không có sự giám sát của con người.

Xem quá trình kết xuất 3D được giải thích tại đây.

Ngày nay, các nhà thiết kế, kỹ sư và kiến trúc sư phải dán nhãn cho mọi khía cạnh của cấu trúc để xây dựng một mô hình 3D có liên quan. Sử dụng thuật toán DeepMind có thể giảm đáng kể thời gian và chi phí cho công việc này, do đó cải thiện hiệu quả của tổ chức.

Kết luận

Trong hầu hết các trường hợp, các ví dụ về mạng lưới Neural Networks được đào tạo tốt hiện hành là minh chứng cho những gì công nghệ này có thể làm, hơn là những gì nó đang làm. Trên thực tế, việc đề xuất các công thức dựa trên những gì mà một chiếc tủ lạnh thông minh nhìn thấy trên giá của nó là một lợi ích hơn là một phúc lợi.

Những cải tiến hơn nữa trong AI sẽ mang lại công nghệ thị giác máy tính tự lực hơn, chính xác hơn, và sẽ phá vỡ hoàn toàn thị trường của các công việc có trình độ thấp và giới thiệu tự động hóa trước đây chưa từng biết tới. Hơn nữa, nó sẽ mang lại hiệu quả chưa từng có cho các lĩnh vực có thể thay đổi cuộc sống: chẩn đoán trong chăm sóc sức khỏe, nông nghiệp chính xác trong ngành công nghiệp thực phẩm, giám sát biến đổi khí hậu, an toàn công cộng và an ninh quốc gia.

Tác giả: Katherine Lazarevich

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây