Thời lượng: 36 giờ

Chứng chỉ: Applied Machine Learning with Python do IT Viet Academy cấp

Giảng viên: IT Viet Academy

Mô tả: Khóa học này cung cấp cho học viên các kiến thức quan trọng và cần thiết về Machine Learning, trang bị kiến thức và kỹ năng vận dụng các thuật toán thuộc nhóm Supervised Learning (Classification, Regression), Unsupervised Learning (Clustering, Association Analysis, Dimensionality Reduction) thông qua việc sử dụng các bộ thư viện và mã nguồn mở Python.

Nội dung khóa học:

  • Tổng quan Machine Learning
    • Giới thiệu
    • Phân loại
    • Supervised Learning
      • Classification 
      • Regression Analysis
    • Unsupervised Learning
      • Clustering
      • Association Analysis
      • Dimensionality Reduction
    • Thuật ngữ
    • Scikit-learn: Machine Learning trong Python
    • Thách thức của Machine Learning: không đủ số lượng dữ liệu, dữ liệu đào tạo không đại diện, dữ liệu có chất lượng kém, thuộc tính không liên quan, Overfitting, Underfitting, cân bằng giữa Bias-Variance…
  • Logistic Regression
    • Binary Classifier
    • Thuật toán: Logistic Regression, phương trình toán học (Sigmoid)
    • Xây dựng Logistic Regression với sklearn.linear_model. LogisticRegression
  • Linear Regression
    • Thuật toán Least Squares
    • Phân loại: Simple Linenear Regression, Multiple Linenear Regression
    • Xây dựng Linear Regression với sklearn. linear_model.LinearRegression
  • Naïve Bayes
    • Phân loại Naïve Bayes: GaussianNB, BernoulliNB và MultinomialNB
    • Thuật toán: Định lý Bayes
    • Xây dựng Naïve Bayes với sklearn.naive_bayes
  • K-Nearest Neighbors (KNN)
    • Thuật toán KNN
    • Xây dựng KNN với sklearn.neighbors.KNeighborsClassifier, sklearn.neighbors.KNeighborsRegressor
  • Decision Tree
    • Thuật toán: Decision Tree
    • Xây dựng Decision Tree với sklearn.tree.DecisionTreeClassifier, sklearn.tree.DecisionRegressor
  • Random Forest
    • Thuật toán: Random Forest
    • Xây dựng Random Forest với sklearn.ensemble. RandomForestClassifier
  • Support Vector Machine (SVM)
    • Kenel trick
    • Thuật toán: Linear SVM, Hard-margin, Soft-margin,  Nonelinear SVM, SVM Kenel, SVM Regression
    • Xây dựng SVM với sklearn.svm.SVM
  • Boosting, AdaBoost
    • Boosting: Giới thiệu, Boosting Algorithms, phân loại
    • AdaBoost (Adaptive Boosting)
    • Thuật toán: AdaBoost
    • Xây dựng AdaBoost với sklearn.ensemble.AdaBoostClassifier
  • Một số kỹ thuật bổ sung
    • Xác thực chéo (Cross Validation)
    • Điều chỉnh tham số (Tunning Parameter)
    • Grid Search (GridSearchCV)
    • Random Search
  • K-Means
    • Thuật toán K-Means Algorithm
    • Elbow Method
    • Xây dựng K-Means với sklearn.cluster.KMeans
  • Hierarchical clustering
    • Phân loại: Divisive (top down), Agglomerative (bottom up)
    • Agglomerative Clustering Algorithm
    • Dendrogram
    • Xây dựng Hierarchical clustering với sklearn.cluster. AgglomerativeClustering
  • Apriori
    • Association Rule Mining
    • Apriori
    • Thuật toán: Apriori (Support, Confidence, Lift)
    • Xây dựng Apriori với mlxtend.frequent_patterns.apriori
  • ECLAT (Equivalence Class Clustering and bottom up Lattice Traversal)
    • Thuật toán: ECLAT
    • Xây dựng ECLAT
  • Gaussian Mixture Model (GMM) và Expectation–maximization (EM)
    • Gaussian Distribution
    • GMM
    • EM
    • Xây dựng GMM với sklearn.mixture.GaussianMixture
  • Dimensionality Reduction, Principal Component Analysis (PCA)
    • Dimensionality Reduction: Curse of Dimensionality, phân loại
    • PCA: giới thiệu, mục tiêu
    • Thuật toán: PCA, Singular Value Decomposition (SVD)
    • Xây dựng PCA với sklearn.decomposition.PCA
  • Locally Linear Embedding (LLE)
    • Thuật toán: LLE
    • Xây dựng LLE với sklearn.manifold.LocallyLinearEmbedding
  • Time Series
    • Dự đoán với ARIMA
    • Thuật toán, variation, decomposition
    • Xây dựng mô hình với auto_arima