digiforce

Data Mining, Machine Learning, Artificial Intelligence and Deep Learning

Đây là bài ra mắt của giáo sư Ace Võ, diễn giả đầu tiên trong 5 diễn giả của webinar “Paths to digital careers”. Ace hiện nay là giáo sư ngành Business Analytics của Đại Học Loyola Marymount ở Los Angeles, Hoa Kỳ.

Bài nguyên gốc bằng tiếng Anh. Bản tiếng Việt do các bạn admins của digiforce dịch ở ngay sau đây:

Data Mining (khai phá dữ liệu), Machine Learning (học máy), Artificial Intelligence (trí tuệ nhân tạo) và Deep Learning (học sâu) là những từ khóa hot những năm gần đây. Chúng là gì, chúng liên quan như thế nào?

Data Mining – Khai phá dữ liệu

Giải thích trong 3 nốt nhạc: Khai phá dữ liệu là việc tìm kiếm các tương đồng trong dữ liệu để giải thích một số hiện tượng.

Data Mining là một thuật ngữ đã cũ so với AI, Machine Learning và Deep Learning. Data Mining là việc hiểu dữ liệu và cách dữ liệu liên quan với nhau. Nó xây dựng trực giác về toàn bộ dữ liệu.

Ví dụ: Những khoản vay nào có khả năng bị vỡ nợ? Data Mining có thể trả lời câu hỏi này.

Artificial Intelligence – Trí tuệ nhân tạo

Giải thích trong 3 nốt nhạc: Trí tuệ nhân tạo là tạo ra những cách mà máy móc có thể bắt chước các hành vi của con người.

AI là một lĩnh vực rộng lớn, có ứng dụng rộng rãi. Không giống như con người, máy tính không thể nói, nhìn, cũng như thực hiện bất kỳ tác vụ nào của con người. AI là một cách để “nhúng” trí thông minh của con người vào máy tính, như tên gọi của nó, một cách nhân tạo. Nó có thể thông qua xử lý và hiểu giọng nói (Alexa, Siri, and Google Now), hình ảnh (computer vision), văn bản. AI rộng và bao trùm tất cả. Nếu bạn đang làm phân tích dữ liệu, bạn là một phần của phong trào AI.

Ví dụ: AI bắt đầu từ những năm 50 và đạt sự công nhận trên toàn thế giới với Deep Blue của IBM. Deep Blue là một trò chơi cờ vua đã đánh bại nhà vô địch cờ vua đang là đương kim vô địch Garry Kasparov một cách dễ dàng. Từ đó, IBM đã tạo ra Watson đánh bại con người trong Jeopardy, and Google đã tạo ra DeepMind đánh bại con người trong cờ vây (defeat humans in Go), một trò chơi cờ vua cổ đại của Trung Quốc

Machine Learning – Máy tính đi học

Giải thích trong 3 nốt nhạc: Machine Learning là cho phép máy “học” bằng cách sử dụng các phương pháp thống kê.

Phần lớn AI là machine learning. Làm thế nào để máy học? Đầu tiên, máy được cung cấp dữ liệu, máy sẽ tạo ra một thuật toán hoặc một cách để liên kết giữa các đầu vào và đầu ra mong muốn. Sau đó, máy sẽ kiểm tra để xem thuật toán hoạt động tốt như thế nào, phương pháp lặp lại cho đến khi thuật toán thực hiện thỏa mãn.

Ví dụ: Thử thách mang đến giải thưởng hàng triệu đô của Netflix (Netflix’s million prize) đánh dấu sự bắt đầu phổ biến của Machine Learning. Trong giải thưởng Netflix, các đội cạnh tranh để tạo ra cách giới thiệu các bộ phim phù hợp cho người dùng của nó. Machine Learning có thể được sử dụng để phê duyệt khoản vay.

Deep Learning – Học sâu

Giải thích trong 3 nốt nhạc: Deep Learning đang tạo ra một cỗ máy bắt chước hoạt động của bộ não chúng ta.

Deep Learning có nguồn gốc từ mạng lưới thần kinh nhân tạo. Mạng lưới thần kinh là một khái niệm về bộ não và mạng lưới các tế bào thần kinh của nó (đó là sự hình thành bộ não của chúng ta). Mạng kết nối các tế bào thần kinh và hoạt động theo cách “bí ẩn” để hiểu thông tin và giải thích chúng cho phù hợp.

Ví dụ: Một bài nói chuyện trên TED của Fei Fei Li (TED talk) nói về cách mạng nơ-ron tích tụ, một loại deep learning, được sử dụng để thực hiện nhận dạng hình ảnh.

KẾT BÀI

Các thuật ngữ này rất giống nhau, vì vậy một vấn đề hay một giải pháp có thể được phân loại dưới một hoặc dưới tất cả các thuật ngữ này. Ví dụ, công nghệ xe hơi tự lái của Tesla có thể được phân loại AI, Deep Learning, và Machine Learning cùng một lúc (tuy nhiên, không quá nhiều về Data Mining!).

Thật ra thì ai làm về dữ liệu cũng rất thích mình được vinh danh là làm về AI, nhưng không phải ai cũng thật sự làm về AI. Vậy còn những ngành nghề liên quan giống như là Data analysis, Data analytics (phân tích dữ liệu), Data Engineer (Kỹ sư dữ liệu), Business Analytics (Phân tích dữ liệu trong kinh doanh), thậm chí là Data Science (Khoa học dữ liệu) thì nằm ở đâu? Các bạn hãy tham gia webinar để biết thêm chi tiết nhé.

Thời gian: 9am – 11:30am ngày Chủ Nhật, 20/02/2022 (giờ Việt Nam)

Test

Link đăng ký: https://gmartek.com/digiforce/webinar-1/

Đây là hoạt động khai trương dự án digiforce, dự án xây dựng cộng đồng chia sẻ thông tin về những nghề nghiệp digital.

Mình nhờ các bạn hãy chia sẻ webinar này đến thật nhiều người nhé. Xin cám ơn các bạn!

Chia sẻ bài viết:
Share on facebook
Share on twitter
Share on linkedin
Xem tất cả các bài viết khác tại đây