[DM-Fall2018] Hướng dẫn nội dung thuyết trình

Chào các em, thầy gửi hướng dẫn về mặt nội dung mà các nhóm phải đảm bảo khi thuyết trình trên lớp. Do các đề tài này có liên quan đến nhau nên các em đọc hết mô tả để có thể trao đổi thêm với nhau để các phần liên quan tới nhau, đặc biệt là phần bài tập. Khi trình bày trên lớp, các nhóm kết hợp dùng slide và bảng để người nghe dễ hiểu hơn.

Đính kèm:

Nhóm 1 ([1] 4.1, 4.2, 4.3):

  • Theo nội dung lý thuyết trong sách [1]
  • Trình bày cách xây dựng Decision Tree Learning, sau đó tìm 1 bài tập cho cả lớp cùng làm và sửa.
  • Phần trình bày cách tính Decision Tree Learning nên dùng bảng mô tả và tính từng bước cho dễ hiểu.
Nhóm 2 ([1] 4.4, 4.5, 4.6):
  • Trình bày các lý do bị overfitting
  • Trình bày cách tính Estimation of Generalization Errors
  • Trình bày cách Handling Overfitting in Decision Tree Induction, trước đó nên đưa ra 1 ví dụ Decision Tree Learning mà bị Overfitting
  • Trình bày cách đánh giá performance của một giải thuật Classifier (4.5 Evaluating the Performance of a Classifier)
  • Trình bày cách so sánh hiệu suất (performance) giữa các giải thuật Classifier (4.6 Methods for Comparing Classifiers)
  • Dựa trên bài tập của Nhóm 1, đưa ra bài tập phù hơp để cả lớp cùng làm.
Nhóm 3 ([1] 5.1 & [2] 8.4):
  • Giới thiệu chi tiết về Rule-Based Classifier, so sánh với Decision tree learning có gì khác/giống, ưu/khuyết
  • Dùng Rule-based Classifier trong tình huống/bài toán nào.
  • Trình bày tất cả các cách xây dựng Rule-based Classifier (5.1.3 How to Build a Rule-Based Classifier). Sau đó, chọn 2 giải thuật trong nhóm các giải thuật được giới thiệu trong sách để minh họa (làm bằng tay) và trình bày trên bảng.
  • Trình bày 5.1.6 Characteristics of Rule-Based Classifiers (các đặc điểm của 1 bộ phân loại Rule-based)
  • Tiếp theo, trong sách [2], tập trung trình bày các nội dung: (1) Rule accuracy and coverage / (2) Rule Extraction from a Decision Tree / (3) Rule Quality Measures / (4) Rule Pruning
  • Đưa ra 1 bài tập cho cả lớp cùng làm.

Nhóm 4 ([1] 5.2, 8.1, 8.2):

  • Giới thiệu về nearest neighbors và các dạng của một giải thuật lazy learners.
  • Trình bày tổng quan giải thuật và đặc điểm của giải thuật NN.
  • Trình bày phần 8.1 để tổng quan về Clustering (phân cụm)
  • Trình bày phần 8.2, trong đó tập trung kỹ vào 8.2.1 và 8.2.2. Cho ví dụ tính toán và minh họa trên bảng cách thực thi thủ công giải thuật.
  • Giới thiệu về ý tưởng của 8.2.3 (Bisecting K-means)
  • Trình bày 8.2.5 Strengths and Weaknesses
  • (Nếu được) Trình bày 8.2.6 K-means as an Optimization Problem.

Nhóm 5 ([1] 5.3, 5.4, 5.6):

  • Trình bày về lý thuyết của Bayes theorem (5.3.1)
  • Trình bày chi tiết các phần từ 5.3.1-5.3.5. Trong đó, mỗi phần cho ví dụ tính toán minh họa, và trình từng bước cách làm.
  • Phần 5.4 và 5.6, chỉ giới thiệu tổng quan, không cần trình bày chi tiết