作者scamilla (..)
看板Statistics
标题[统计] 回归分析
时间Mon Mar 6 01:35:26 2006
※ [本文转录自 Math 看板]
作者: scamilla (..) 看板: Math
标题: [统计] 回归分析
时间: Mon Mar 6 01:29:24 2006
已知一X、Y分布图,欲以线性回归分析其趋势
1. 若所选取资料数较少时,各笔资料差异性较小,因此相关系数较大,
不过也因为所选取资料数占整体资料数的比例较小,因此利用这些所选取出
来的资料表现线性回归的趋势似乎较不完整。
2. 若所选取资料数较多时,各笔资料差异性较大,因此相关系数较小,不过
也因为所选取资料数占整体资料数的比例较大,因此利用这些所选取出来
的资料表现线性回归的趋势似乎较资料数较少时完整。
就资料处理的观念,相关系数似乎可以当作是线性回归结果正确性与否的
指标,若相关系数越高,则代表各笔资料相当符合曲线;而就抽取样本来
说,所抽取样本的比例越高,越能符合事件所代表的意义,也就是说若把
大部分的资料都列入观察,那麽所观察到的也近乎最初的X、Y散布。
以上两者各有优缺点又互相矛盾,举极端为例,若取两笔资料作线性
回归,相关系数当然为1,不过所呈现出来的趋势正确性如何?应该是
低到不可信吧!?若取全部的资料作线性回归,所呈现的趋势不论好
坏,都是完成的呈现这个事件,不过相关系数却也降低了不少。
请问(1):如何在上述两项资料处理的作法取得一个平衡?正确的说,如何选
择资料数的多寡来分析?
请问(2):是否有一指数或是相关的理论来分析相关系数的高低与资料数的多
寡间的关系?
***不知道我的表达方式好不好或是我所知道的对与否,如果有错请不吝指教
,希望各位统计高手能帮我解答,感谢!
--
「暗恋的幸福,是你正为着对方做任何事,而他却不清楚,
此时你心中的甜与苦」
「猜测着自己喜欢的人的心思,是累.是痛.是苦.也是幸福」
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.171.142.105
--
「暗恋的幸福,是你正为着对方做任何事,而他却不清楚,
此时你心中的甜与苦」
「猜测着自己喜欢的人的心思,是累.是痛.是苦.也是幸福」
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.171.142.105