作者lovekkk (kk)
看板CSSE
标题Re: [问题] 为何叫电脑科学
时间Wed Aug 6 14:26:41 2008
※ 引述《as1986 ( )》之铭言:
: ※ 引述《Arton0306 (Ar藤)》之铭言:
: : 念CS几年下来
: : 突然不知CS中的S science的部份在哪里
: : 像理论方面 algo computation theory graphy theory... 这些都是数学
: : 其它os archi compiler 这比较像工程、设计方面的
: : 至於偏电机的科目就更不用说了
: : 像物理、化学、生物
: : 都有一些理论 这些理论是从实验而验证的 往後也可能一直修正
: : 这也是以往所学的科学方法
: : 但目前我在cs学到的好像很少有这样
: : 比较像的大概是data mining 猜一些特徵 经实验 再去想这些特徵的关连性...等
: : 但这似乎更接近统计学
: : 所以想请教这个science指的是哪部份??
: 有一个相关的问题一直很好奇,就是我们如果透过统计方法让机器从数据中得到一些
: 参数,我们应该相信那些参数到什麽程度?我指的不是像把台湾二十世纪中每年三十
: 岁男性的身高平均算出来,用这些数据拿来当成某个理论的证据而已;我想问如果我
: 们有个神妙的算法,神妙到没有什麽真正使用的人知道他的每一个步骤有什麽现实的
: 意义,但是却能够给一堆数据某种在统计上合理的解释(例如可以输出一个非常相似
: 的 generative model) 那麽我们能够把那个算法的解释当成像平均数那样,更进一
: 步给予现实世界的解释吗?
: 会这样问是因为看到 clustering 被广泛应用,但是我很好奇能不能够说「因为这堆
: 资料利用 K-means 跑出来会分成这两堆,所以我们宣称......」这样的话?
: 和统计还有机器学习不太熟,如果说错什麽请大家指正 谢谢!
我的看法是"看情况"
例如像你说的K-means, 使用上时常也是用几个不同的k,
每个k再重覆跑很多次, 看有没有哪个k某几次跑出来的结果看起来比较合理
或者像统计上的相关性,
可能可以找到像"电线杆越多的国家, 某些文明病的发生率较高"这种相关
然而因此结论便是"电线杆导致某些文明病"吗? 大多不是
而可能是电线杆较多的国家开发程度也许较高,
也许速食比较盛行, 或吃大鱼大肉, 比较多宅宅以OLG或电玩等当休闲较少运动,
污染较严重, 农药使用较普遍, 较会用抗生素荷尔蒙喂养鸡猪牛等等,
因而导致某些文明病较盛行
也就是说, 找出运作机制仍是相当重要而难以省略的,
例如, 一个国家的肝癌发生率年年提升时, 这几年中同时提升的,
可能用电线杆数量, 国民饮食的蛋白质摄取量, 汽机车数量及废气排放量等,
而究竟是其中何者真正影响到肝癌发生率则是需要进一步研究,
找出这数种因素在生物层面上影响肝癌的作用机制才能强化证据
而那些神妙的方法, 我觉得用来找出要进一步深入研究的目标就很好了,
而找出的那些目标究竟是否为真, 合不合理还是要靠人判断
如果期待那些方法能直接找出"确切的证据", 目前似乎还不太可能
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.166.54.53
1F:推 TroyLee:可是电线杆逐渐在地下化了 08/06 15:08
2F:推 revivalworld:应该是 电线杆密度 08/06 19:01