作者edward8726 (Any Longer)
看板NTUST_STUDY
标题[课程] 资料科学导论 陈怡伶
时间Wed Jan 29 18:53:42 2020
系 所:资讯工程系
教 师:陈怡伶
必 选 修:必修
学 分:3
心 得:
Programming Assignments: 60%
Final Project: 40%
Class Participation: extra 5%~10% bonus
上课内容以Introduction to Data Mining, 2nd Edition这本的内容为主
classification, KNN, SVM, grouping, association等等的内容都会提到
1. Homework
会有三次的程式作业 取两次较高成绩
三次作业分别是:
1. Classification
2. Grouping
3. Associative analysis
都是在Kaggle上进行班内竞赛 所以程式成绩是相对的
有过Baseline最少会有70分 没过理论上是0分 但有时没过的人太多会斟酌给分
(在这边提醒一下,Public leaderboard的baseline跟Private的不一样,所以过了public
的baseline不代表一定过private)
每次作业也要交一个报告 占40% 别乱写 该写的都有写到应该都可以拿高分
而每个作业的实作方法都没有限制 用课堂没教过的东西来做也可以
2. Project
这部份三个人一组 挑一个自己喜欢的主题来做 并生出一些成果
主题五花八门
例如酒品预测、车祸原因分析、CS:GO的战情分析、MLB银棒奖预测...等
真的不知道要做什麽就上Kaggle找一些入门主题也OK 重点是要有成果
期末要上台报告并接受老师/同学提问
-------
大概是这样
建议作业要好好做 毕竟才两次 Kaggle认真刷一下都有机会拿高分
算是一堂满甜的课
推 荐 度:★ * 4 (最少一颗 最多五颗)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.252.28.62 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/NTUST_STUDY/M.1580295225.A.A56.html
※ 编辑: edward8726 (111.252.28.62 台湾), 01/29/2020 18:54:53