Machine learning được phân loại chủ yếu như sau :
Machine learning phát triển từ trái sang phải như được hiển thị ở sơ đồ phía trên :
- Ban đầu, các nhà nghiên cứu bắt đầu với Học có giám sát( Supervised Learning). Đây là trường hợp dự đoán giá nhà ở đã thảo luận trước đó.
- Sau đó là học không giám sát( Unsupervised Learning ), ở đây máy móc có thể học bất cứ thứ gì mà không cần phải giám sát
- Các nhà khoa học phát hiện thêm rằng có thể là một ý tưởng hay khi máy tính thực hiện đúng công việc và được thưởng , và đó được gọi là Học tập tăng cường (Reinforcement Learning).
- Rất nhanh chóng, dữ liệu có sẵn ngày nay đã trở nên khổng lồ đến mức các kỹ thuật thông thường được phát triển cho đến nay không thể phân tích dữ liệu lớn và cung cấp cho chúng ta dự đoán.
- Do đó, Học sâu (Deep learning) đã xuất hiện trong đó bộ não con người được mô phỏng trong Mạng thần kinh nhân tạo (ANN) được tạo ra trong máy tính nhị phân của chúng ta.
- Máy hiện có thể tự học bằng cách sử dụng sức mạnh tính toán cao và tài nguyên bộ nhớ khổng lồ hiện có.
- Hiện tại, có thể thấy rằng Học sâu (Deep Learning) đã giải quyết được nhiều vấn đề nan giải trước đây
- Kỹ thuật này hiện đã được nâng cao hơn nữa bằng cách tặng thưởng cho các mạng Deep Learning khi thực hiện đúng công việc nào đó và cuối cùng là Deep Reinforcement Learning ra đời.
Bây giờ chúng ta hãy nghiên cứu chi tiết hơn từng loại này.
1. Supervised Learning :
Học tập có giám sát tương tự như việc huấn luyện một đứa trẻ tập đi. Bạn sẽ nắm tay trẻ, hướng dẫn trẻ cách đưa chân về phía trước, tự đi bộ để trình diễn, ... cho đến khi trẻ học cách tự đi.
Học có giám sát bao gồm 2 bài toán : Hồi quy (Regression) và phân loại (Classificaiton)
a. Hồi quy (Regression) :
Tương tự, trong trường hợp học có giám sát, bạn đưa ra các ví dụ cụ thể đã biết cho máy tính. Bạn nói rằng đối với giá trị đặc trưng đã cho x1, đầu ra là y1, đối với x2 là y2, đối với x3 là y3, .... Dựa trên dữ liệu này, bạn cho phép máy tính tìm ra mối quan hệ thực nghiệm giữa x và y.
Sau khi máy được huấn luyện theo cách này với đủ số điểm dữ liệu, bây giờ bạn sẽ yêu cầu máy dự đoán Y cho một X. Giả sử rằng bạn biết giá trị thực của Y cho X đã cho này, bạn sẽ có thể suy ra dự đoán của máy có đúng không.
Do đó, bạn sẽ kiểm tra xem máy đã học hay chưa bằng cách sử dụng dữ liệu kiểm tra đã biết. Một khi bạn hài lòng rằng máy có thể thực hiện các dự đoán với mức độ chính xác mong muốn (giả sử từ 80 đến 90%), bạn có thể ngừng đào tạo thêm cho máy.
Giờ đây, bạn có thể yên tâm sử dụng thuật toán để thực hiện các dự đoán trên các điểm dữ liệu chưa biết hoặc yêu cầu máy dự đoán Y cho một điểm X cho trước mà bạn không biết giá trị thực của Y. Bài tập này thuộc về hồi quy mà ta đã đề cập ở bài trước.
b. Phân loại (Classification):
Bạn cũng có thể sử dụng các kỹ thuật học máy cho các vấn đề phân loại. Trong các bài toán phân loại, bạn phân loại các đối tượng có bản chất tương tự thành một nhóm duy nhất. Ví dụ, trong một nhóm 100 sinh viên nói, bạn có thể muốn nhóm họ thành ba nhóm dựa trên chiều cao của họ : thấp, trung bình và cao. Đo chiều cao của từng học sinh, bạn sẽ xếp họ vào nhóm thích hợp.
Bây giờ, khi một học sinh mới đến, bạn sẽ xếp anh ta vào một nhóm thích hợp bằng cách đo chiều cao của anh ta. Bằng cách tuân theo các nguyên tắc trong mô hình hồi quy, bạn sẽ đào tạo máy phân loại học sinh dựa trên đặc điểm của anh ta ( chiều cao ). Khi máy học cách các nhóm được thành lập, nó sẽ có thể phân loại chính xác bất kỳ học sinh mới nào chưa biết. Một lần nữa, bạn sẽ sử dụng dữ liệu thử nghiệm để xác minh rằng máy đã học được kỹ thuật phân loại của bạn trước khi đưa mô hình ứng dụng vào thực tế.
Học giám sát là nơi AI thực sự bắt đầu hành trình của mình. Kỹ thuật này đã được áp dụng thành công trong một số trường hợp. mô hình này được sử dụng trong khi thực hiện nhận dạng chữ viết tay. Một số thuật toán đã được phát triển để học có giám sát. Chúng ta sẽ tìm hiểu kĩ về các thuật toán này trong các chương sau.
Ở bài tiếp theo aa sẽ tìm hiểu các bài toán còn lại nhé .