97 年第一學期 Data Mining 「期末報告」成績

  • 報告寫作:10%
  • 技術與方法使用(Methods): 30%
  • 變數選取、結論:各 5%
  • 內容分析 (Analysis): 50%

  • 報告成績:Total

  • 期末報告的普遍缺點:

    • 整個學期所學的各種方法(至少六種以上) 只用到一兩種
    • 沒有對所有變數先作基本敘述統計分析
    • 電腦 Output 的詮釋太少、或懶得從錯誤分類比例算出正確分類比例
    • Decision Tree 懶得畫圖、或 Tree Plot 畫錯
    • 報告寫作過度草率
    • 變數選擇不切實際,或同質性過高,甚至是 Y 幾乎 = X,無法作有效預測或詮釋
      例如,「是否為瑕疵戶」幾乎等於「是否有拒絕往來紀錄」、「是否有退票紀錄」
    • 對所用的方法認識不清,作出錯誤的詮釋
    • 結論草率

組別 報告
寫作
變數
選擇
Tree Cluster NN Assoc 其他
軟體
其他
方法
Methods Analysis 結論 Total
1 75 75 Q,C   nnet(?) yes   LDA 70 73 72 72.35
2 80 85 Q,C   nnet(?) yes   LDA 70 75 75 74.50
3 50 77 C45     yes     55 45 50 50.35
4 65 70 Q(no plot),C45     yes     57 70 65 65.35
5 70 70 Q,C45     yes     60 73 80 69.00
6 78 80 Q,C,C45           60 65 70 65.80
7 70 77 Q,C     yes   LDA 70 73 70 71.85
8 70 77 J48 Kmean(?)   yes   LDA 68 72 50 69.75
9 72 80 C45 Kmean       LDA,Logistic 75 75 70 74.70
10 75 70 C45(no plot)   yes     55 70 70 66.00
10_2 77 73 C45 Kmean   yes     60 75 75 70.60
11 75 77 C45(?)   Quest ??? yes     58 75 75 70.00
12 90 85 7 methods/CHAID Kmean nnet,MLP yes Weka,Sipina LDA 90 85 90 87.25
13 72 70 C45 Kmean   yes     65 72 65 69.45
14 78 80 C45 Kmean nnet     Bayes 75 75 72 75.40
15 75 80 C45 2 Kmean Bayes NN yes Weka   85 82 90 82.50
16 68 77 C45 Kmean         58 70 50 65.55
17 75 75 C45     yes     58 72 70 68.15
18 65 70 C45         LDA(無分析) 50 50 50 52.50