Dân chủ hóa trí tuệ nhân tạo (AI) cho Khoa học Dữ liệu

Trí tuệ nhân tạo sẽ đóng một vai trò quan trọng trong tương lai của công nghệ và kinh doanh, và trí thông minh này cần phải truy cập được đối với những người muốn sử dụng nó.

0

Khi chúng ta nhìn vào các công ty có ảnh hưởng nhất trên thế giới như Microsoft, Facebook, Google, Amazon, Netflix, v.v…, họ có nhiều điểm tương đồng. Tất cả đều sở hữu rất nhiều dữ liệu và giờ đã thành thạo nghệ thuật ứng dụng AI vào kinh doanh!

Kể cả khi mọi người đều nói về AI hay sử dụng các từ thông dụng như “Khoa học dữ liệu”, “Học máy”, và “Học sâu”, chỉ có một số ít các công ty đang thực sự sử dụng AI như một phần của hoạt động kinh doanh chính.

Một nghiên cứu của công ty đầu tư mạo hiểm tập trung phát triền nghiên cứu MMC Ventures đã chỉ ra rằng, ở châu Âu, chỉ có 60% các công ty khởi nghiệp thực sự sử dụng AI theo cách có ích cho đề xuất giá trị mặt hàng/dịch vụ của họ [1]. Nếu chúng tôi bao gồm tất cả các công ty mới thành lập và  đã hoạt động ổn định, tỷ lệ này sẽ còn giảm hơn nữa.

Ban đầu, điều này có vẻ đáng ngạc nhiên. Nhưng, nó có thực sự đáng ngạc nhiên không? Một loạt các kỹ năng rất phức tạp, bao gồm mã hóa, thống kê, phân tích dữ liệu và kiến thức về miền cụ thể được yêu cầu để thực hiện các giải pháp AI. Không có nhiều người có trình độ cho việc cài đặt này và những người đang có khả năng lại rất tốn kém để thuê. Ngoài ra, cần một lượng lớn dữ liệu để đào tạo các mô hình AI. Thiết lập cơ sở hạ tầng dữ liệu cần thiết cần một khoản đầu tư ban đầu mà nhiều công ty khá miễn cưỡng thực hiện, bất chấp lợi ích kinh doanh mà công nghệ có thể mang lại.

Để tận dụng toàn bộ sức mạnh của AI và giải quyết những thách thức này, công nghệ cần phải được phổ biến với nhiều doanh nghiệp hơn, nói cách khác, cần phải giải quyết vấn đề “Dân chủ hóa AI”. Bài viết này sẽ đề cập đến quá trình dân chủ hóa AI này (đặc biệt là phần Machine Learning của nó), các bước cần thiết để làm như vậy và cách giảm thiểu rủi ro mà nó mang lại.

Trước tiên là một số thuật ngữ

Trước khi chúng ta đi thẳng vào cuộc thảo luận, hãy để làm rõ một vài thuật ngữ chính và cách chúng liên quan đến nhau. Một số từ thông dụng thực sự chỉ là tập hợp con của nhau, ví dụ: Deep Learning là một phần của Neural Networks. Neural Networks là một tập hợp con của Machine Learning – một tập hợp con của AI. AI là một thuật ngữ rộng mô tả bất kỳ kỹ thuật nào cố gắng bắt chước các khả năng của con người. Nhưng, các mô hình dự đoán, mà chúng ta sẽ thảo luận sau này, sẽ rơi vào danh mục Machine Learning, nơi thuật toán học từ dữ liệu lịch sử và khám phá các mẫu để có thể đưa ra dự đoán dựa trên dữ liệu mới.

“Dân chủ hóa Trí tuệ nhân tạo” – Điều đó có nghĩa là gì và tại sao lại cần thiết?

Việc dân chủ hóa AI có nghĩa là làm cho nó dễ tiếp cận hơn với nhiều doanh nghiệp và người dùng doanh nghiệp. Hiện tại, không có nhiều người có kiến thức nền tảng để hiểu các ứng dụng AI, nhưng mọi người đều có thể được hưởng lợi từ sức mạnh của AI bởi vì, cuối cùng, “Tri thức là sức mạnh”. Quyền lực này hiện đang nằm trong tay của một chọn một vài cá thể, đó là lý do tại sao nó phải được trải ra để tiếp cận nhiều người hơn.

Làm cho AI phổ biến sẽ tăng số người có thể tương tác với nó. Sự mở rộng này cho phép các ứng dụng lan rộng sang các lĩnh vực mới và giải phóng thời gian của các chuyên gia AI để xây dựng các phát triển tiên tiến.

Các bước tiến tới “Dân chủ hóa trí tuệ nhân tạo”

  1. Khả năng truy cập và chất lượng dữ liệu

“Dữ liệu là một loại dầu mới”, “Kết quả của bạn chỉ tốt như dữ liệu của bạn” hay “Đầu vào tốt đầu ra mới tốt”, v.v…- chúng ta đã nghe những câu châm ngôn này nhiều lần, nhưng thực tế là việc duy trì tổ chức và chất lượng dữ liệu kinh doanh vẫn là một thách thức lớn. Thu thập số lượng lớn dữ liệu đã dần trở nên dễ dàng hơn và phải chăng hơn trong những năm qua, tuy nhiên, hầu hết các công ty vẫn đang ở một trong ba tình huống sau:

• Họ có sẵn dữ liệu hạn chế, khiến việc xây dựng các mô hình AI chính xác trở nên khó khăn.

• Họ có chất lượng dữ liệu kém, làm cho các mô hình AI kết quả không ổn định và có khả năng gây hiểu lầm.

• Dữ liệu của họ được quản lý kém và tổ chức kém, khiến việc tự động hóa các quy trình và sản xuất mô hình AI mất nhiều thời gian và tốn kém.

Các mô hình AI chỉ cho kết quả đáng tin cậy nếu chúng học được từ dữ liệu phù hợp. Dân chủ hóa phần mô hình của quy trình sẽ là không đủ nếu chúng ta cũng không thể dân chủ hóa phần quản lý dữ liệu của nó.

Điều quan trọng là văn hóa bảo tồn dữ liệu, đảm bảo chất lượng và tổ chức được dạy ở tất cả các cấp độ, từ cơ bản đến giáo dục đại học, rời khỏi lĩnh vực khoa học dữ liệu và thâm nhập vào các khía cạnh khác, đặc biệt là trong thế giới kinh doanh. Các khóa đào tạo cho các công ty về cách định giá và xử lý đúng dữ liệu của họ là những cách rút ngắn khả thi, trong khi giáo dục của phần còn lại của dân số có thể mất nhiều thập kỷ.

2. Giao diện thân thiện với người dùng

Có bao nhiêu người có thể vận hành máy tính khi chúng lần đầu tiên được phát minh? Không nhiều! Ngày nay, ngay cả trẻ mới biết đi cũng có thể sử dụng iPad và một điểm khác biệt lớn khiến điều này trở nên khả thi là sự phát triển của giao diện người dùng trong những năm qua.

Một nhà khoa học dữ liệu bình thường phụ thuộc rất nhiều vào các kỹ năng mã hóa trong suốt một dự án phân tích. Do mã hóa ban đầu có thể đáng sợ, nên các giao diện thân thiện với người dùng đơn giản hơn với các công cụ mã hóa cho phép dân số ít hiểu biết về công nghệ cũng có thể tương tác với dữ liệu của họ. Với các nhà cung cấp dịch vụ đám mây lớn, ví dụ như Microsoft đầu ngành, ngày càng nhiều nền tảng phân tích tự phục vụ (ví dụ: Azure ML) đang xuất hiện trên thị trường. Chúng sẽ giúp tương tác với AI trực quan hơn.

3. Giải thích về kết quả

Giả sử bạn vượt qua những thách thức ban đầu về việc truy cập, thu thập và làm sạch dữ liệu của bạn và bạn đã xây dựng mô hình dự đoán đầu tiên của mình. Bây giờ bạn phải quay trở lại kinh doanh và trình bày kết quả của bạn. Làm thế nào để bạn thuyết phục ai đó tin tưởng và hành động theo dự đoán của mô hình của bạn? Giải thích kết quả chính là câu trả lời! Bạn có thể cần phải hy sinh một số độ chính xác của mô hình để có đầu ra dễ hiểu.

Sử dụng mô hình hộp đen, mô hình mà bạn biết đầu vào và bạn nhận được đầu ra, nhưng bạn không biết điều gì xảy ra ở giữa, có thể không phải là giải pháp khả thi vì bạn không chỉ muốn doanh nghiệp tin tưởng vào kết quả của bạn, bạn cũng muốn họ hành động theo những kết quả đó. Hiểu các trình điều khiển của một hành vi nhất định là những gì cho phép bạn thực hiện các hành động chính xác và tạo ra một tác động thực sự đối với doanh nghiệp của bạn. Vì vậy, thay vì chỉ tập trung vào dữ liệu chứa thông tin về những gì bạn đang điều tra, hãy nghĩ đến thông tin bổ sung có thể điều khiển một hành vi nhất định. Và đây là lý do tại sao nó rất quan trọng để làm việc trong các nhóm đa chức năng với các chuyên gia thuộc lĩnh vực đó từ đơn vị kinh doanh.

Giảm thiểu rủi ro của “Dân chủ hóa AI

Như mọi khi, đổi mới và thay đổi không thể đến mà không có rủi ro. Nhưng điều này không nên ngăn cản chúng ta mở rộng tầm nhìn. Chúng ta chỉ cần học cách kiểm soát rủi ro.

Hãy để tự động hóa hoàn toàn quá trình từ xử lý dữ liệu đến mô hình hóa và cho phép mọi người xây dựng các mô hình dự đoán cá nhân của riêng họ. Bạn có thể nghĩ “Điều gì có thể sai lệch được chứ?”. Vâng, như đã đề cập ở trên, một loạt các kỹ năng kỹ thuật cao được yêu cầu để có thể nhận được kết quả khả thi từ dữ liệu của bạn. Một số bộ phận có thể được tạo điều kiện hoặc tự động bằng cách sử dụng các chức năng mô hình hóa kéo và thả đơn giản, tuy nhiên, một máy chỉ tuân theo các quy tắc cuối cùng. Nếu bạn gian lận (và điều này có thể xảy ra ngoài ý muốn) theo cách bạn thiết lập vấn đề của mình, máy sẽ học và áp dụng các quy tắc sai và do đó tạo ra kết quả không sử dụng được. Nắm bắt những sai lầm này hoặc đôi khi thậm chí xác định các hạn chế của thuật toán, là điều đòi hỏi kiến ​​thức khoa học dữ liệu chuyên ngành. Làm cho AI dễ dàng tiếp cận hơn với những người không có kiến ​​thức cần thiết có thể dẫn đến việc giải thích sai về kết quả. Không có một số liệu nào nêu rõ mô hình nào sẽ sử dụng được và mức độ hiệu quả của nó. Đây là một vấn đề thử nghiệm và so sánh các thuật toán khác nhau với các thông số và số liệu khác nhau, và cuối cùng, tất cả đều bắt nguồn từ kinh nghiệm và bí quyết chuyên môn.

Vậy, chúng ta có thể làm gì để tránh điều này? Trước hết, điều quan trọng là chia sẻ kiến thức về khoa học dữ liệu và đảm bảo rằng những người tương tác với nền tảng phân tích tự phục vụ có hiểu biết cơ bản về những gì diễn ra sau giao diện đơn giản và thân thiện với người dùng do nền tảng cung cấp.

Thứ hai, thay vì cố gắng dân chủ hóa AI nói chung, chúng ta nên tập trung vào một vài ứng dụng, nhưng làm cho những ứng dụng đó càng phổ biến càng tốt. Tự động hóa một số trường hợp sử dụng đơn giản và rộng rãi hơn như dự đoán về giao dịch hoặc mặc định tín dụng sẽ cho phép người dùng doanh nghiệp tập trung nỗ lực vào việc học cách diễn giải và đánh giá chính xác kết quả và sau đó doanh nghiệp có thể tập trung nguồn lực khoa học dữ liệu hạn chế đã có trải nghiệm thực của họ trong các trường hợp sử dụng phức tạp hơn.

Kết luận

Dân chủ hóa AI không phải là một quá trình dễ dàng và đơn giản có thể diễn ra trong một đêm, và nó chắc chắn không đến mà không có rủi ro. Tuy nhiên, có một điều chắc chắn là: bằng cách này hay cách khác, điều đó sẽ xảy ra. Vì vậy, nếu bạn muốn doanh nghiệp của mình tham gia vào nhóm các công ty có ảnh hưởng nhất trên thế giới và thành công, bạn cần phải cam kết nhúng AI vào các chức năng kinh doanh của mình.

Tác giả: Bianca Ferri thuộc SparkBeyond (21/10/2019)

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây