作者lovekkk (kk)
看板CSSE
標題Re: [問題] 為何叫電腦科學
時間Wed Aug 6 14:26:41 2008
※ 引述《as1986 ( )》之銘言:
: ※ 引述《Arton0306 (Ar藤)》之銘言:
: : 唸CS幾年下來
: : 突然不知CS中的S science的部份在哪裡
: : 像理論方面 algo computation theory graphy theory... 這些都是數學
: : 其它os archi compiler 這比較像工程、設計方面的
: : 至於偏電機的科目就更不用說了
: : 像物理、化學、生物
: : 都有一些理論 這些理論是從實驗而驗證的 往後也可能一直修正
: : 這也是以往所學的科學方法
: : 但目前我在cs學到的好像很少有這樣
: : 比較像的大概是data mining 猜一些特徵 經實驗 再去想這些特徵的關連性...等
: : 但這似乎更接近統計學
: : 所以想請教這個science指的是哪部份??
: 有一個相關的問題一直很好奇,就是我們如果透過統計方法讓機器從數據中得到一些
: 參數,我們應該相信那些參數到什麼程度?我指的不是像把台灣二十世紀中每年三十
: 歲男性的身高平均算出來,用這些數據拿來當成某個理論的證據而已;我想問如果我
: 們有個神妙的算法,神妙到沒有什麼真正使用的人知道他的每一個步驟有什麼現實的
: 意義,但是卻能夠給一堆數據某種在統計上合理的解釋(例如可以輸出一個非常相似
: 的 generative model) 那麼我們能夠把那個算法的解釋當成像平均數那樣,更進一
: 步給予現實世界的解釋嗎?
: 會這樣問是因為看到 clustering 被廣泛應用,但是我很好奇能不能夠說「因為這堆
: 資料利用 K-means 跑出來會分成這兩堆,所以我們宣稱......」這樣的話?
: 和統計還有機器學習不太熟,如果說錯什麼請大家指正 謝謝!
我的看法是"看情況"
例如像你說的K-means, 使用上時常也是用幾個不同的k,
每個k再重覆跑很多次, 看有沒有哪個k某幾次跑出來的結果看起來比較合理
或者像統計上的相關性,
可能可以找到像"電線桿越多的國家, 某些文明病的發生率較高"這種相關
然而因此結論便是"電線桿導致某些文明病"嗎? 大多不是
而可能是電線桿較多的國家開發程度也許較高,
也許速食比較盛行, 或吃大魚大肉, 比較多宅宅以OLG或電玩等當休閒較少運動,
污染較嚴重, 農藥使用較普遍, 較會用抗生素荷爾蒙餵養雞豬牛等等,
因而導致某些文明病較盛行
也就是說, 找出運作機制仍是相當重要而難以省略的,
例如, 一個國家的肝癌發生率年年提升時, 這幾年中同時提升的,
可能用電線桿數量, 國民飲食的蛋白質攝取量, 汽機車數量及廢氣排放量等,
而究竟是其中何者真正影響到肝癌發生率則是需要進一步研究,
找出這數種因素在生物層面上影響肝癌的作用機制才能強化證據
而那些神妙的方法, 我覺得用來找出要進一步深入研究的目標就很好了,
而找出的那些目標究竟是否為真, 合不合理還是要靠人判斷
如果期待那些方法能直接找出"確切的證據", 目前似乎還不太可能
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.166.54.53
1F:推 TroyLee:可是電線桿逐漸在地下化了 08/06 15:08
2F:推 revivalworld:應該是 電線桿密度 08/06 19:01