作者piggood (成为有品味的男人)
看板Statistics
标题Re: [统计] 回归分析
时间Mon Mar 6 17:56:15 2006
※ 引述《scamilla (..)》之铭言:
: ※ [本文转录自 Math 看板]
: 作者: scamilla (..) 看板: Math
: 标题: [统计] 回归分析
: 时间: Mon Mar 6 01:29:24 2006
: 已知一X、Y分布图,欲以线性回归分析其趋势
: 1. 若所选取资料数较少时,各笔资料差异性较小,因此相关系数较大,
: 不过也因为所选取资料数占整体资料数的比例较小,因此利用这些所选取出
: 来的资料表现线性回归的趋势似乎较不完整。
: 2. 若所选取资料数较多时,各笔资料差异性较大,因此相关系数较小,不过
: 也因为所选取资料数占整体资料数的比例较大,因此利用这些所选取出来
: 的资料表现线性回归的趋势似乎较资料数较少时完整。
: 就资料处理的观念,相关系数似乎可以当作是线性回归结果正确性与否的
: 指标,若相关系数越高,则代表各笔资料相当符合曲线;而就抽取样本来
: 说,所抽取样本的比例越高,越能符合事件所代表的意义,也就是说若把
: 大部分的资料都列入观察,那麽所观察到的也近乎最初的X、Y散布。
: 以上两者各有优缺点又互相矛盾,举极端为例,若取两笔资料作线性
: 回归,相关系数当然为1,不过所呈现出来的趋势正确性如何?应该是
: 低到不可信吧!?若取全部的资料作线性回归,所呈现的趋势不论好
: 坏,都是完成的呈现这个事件,不过相关系数却也降低了不少。
: 请问(1):如何在上述两项资料处理的作法取得一个平衡?正确的说,如何选
: 择资料数的多寡来分析?
你的「整体资料数」是指你的整个样本数还是母群体??
如果是样本数的话,当然是全下啦~~~不过最好是经过样本数的估计步骤
如果是母群体的话,也是全下,就做普查吧~~
如果全下後相关会低是因为真实情形就是如此(如果抽样没问题的话)
想要相关高,而去挑选样本,简单说就是假的结果
: 请问(2):是否有一指数或是相关的理论来分析相关系数的高低与资料数的多
: 寡间的关系?
做检定吧~~~
简单回归的话就 检定r 或是 检定斜率 皆可
检定就会考虑样本数的大小了
样本小比较不容易通过检定,就算他的r接近1
或是求r的95信赖区间,相信样本大的信赖区间会较窄
: ***不知道我的表达方式好不好或是我所知道的对与否,如果有错请不吝指教
: ,希望各位统计高手能帮我解答,感谢!
我想我应该是没有看错你要问的
希望有回答到
一点浅见
谢谢
--
大人总是喜欢提一些我们小时候的事,而且说了几百遍也不腻………
知道为什麽吗?
因为这是他们唯一可以表示跟我们关系还是很亲密的方式…………
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.25.118.31