作者piggood (成为有品味的男人)
看板Statistics
标题Re: [统计] 回归分析
时间Mon Mar 6 18:18:42 2006
※ 引述《cug ( 比目鱼  )》之铭言:
: ※ 引述《scamilla (..)》之铭言:
: : 作者: scamilla (..) 看板: Math
: : 标题: [统计] 回归分析
: : 时间: Mon Mar 6 01:29:24 2006
: : 已知一X、Y分布图,欲以线性回归分析其趋势
: : 1. 若所选取资料数较少时,各笔资料差异性较小,因此相关系数较大,
: : 不过也因为所选取资料数占整体资料数的比例较小,因此利用这些所选取出
: : 来的资料表现线性回归的趋势似乎较不完整。
: 我的想法是 n变小 var要变大的啊
: var变大 那相关系数应该要变小
: 所以无法理解n小时差异较小的想法
想像一下,假设是全校的外貌当母群体
一个学校内一定有超美的校花,也会有相当不太起眼的人
不过大部份还是中间的人,就是长的还不太美,可是也不太丑的人
(假设符合常态的话,别跟我争说你的学校是右偏)
现在随机抽出50人成为一个班
班上大部份的人还是普通普通,也有美的,也有不起眼的
但美的一定很难美过校花,丑也很难丑过全校中最不起眼的人
所以变异情形很难大於全校
也有可能校花在那一班里,不过机率还是低,毕竟中间的人这麽多
n再小一点好了,就两个人
再抽也很难抽到常态分配的两端
两个都是会中间的人,所以变异情形也不会太大
没什麽理论,只是用一般的言语表达,不知道对不对
例子只是好玩,看不惯的话,可以改成「善良的程度」,结果一样^^
: : 2. 若所选取资料数较多时,各笔资料差异性较大,因此相关系数较小,不过
: : 也因为所选取资料数占整体资料数的比例较大,因此利用这些所选取出来
: : 的资料表现线性回归的趋势似乎较资料数较少时完整。
: : 就资料处理的观念,
: “相关系数似乎可以当作是线性回归结果正确性与否的指标”
: 这句话怪怪的 没有看过书上说过有这种事情
: 事实上 反而应该是要小心不要以为判定系数可以决定回归配适的好坏
: : ,若相关系数越高,则代表各笔资料相当符合曲线;而就抽取样本来
: 上面这句话是在说判定系数越高表示x可以解释y的能力越高吗?
: 如果不是的话 相关系数越高代表的应该是数据有高度的相关
: 与什麽曲线有关吗? 没学过这种事情
: : 说,所抽取样本的比例越高,越能符合事件所代表的意义,也就是说若把
: : 大部分的资料都列入观察,那麽所观察到的也近乎最初的X、Y散布。
: 就判定系数来说 确实放入的“变数”越多 判定系数只会增加不会减少
: 所以需要调整後的判定系数辅助判断
: : 以上两者各有优缺点又互相矛盾,举极端为例,若取两笔资料作线性
: : 回归,相关系数当然为1,不过所呈现出来的趋势正确性如何?应该是
: : 低到不可信吧!?若取全部的资料作线性回归,所呈现的趋势不论好
: : 坏,都是完成的呈现这个事件,不过相关系数却也降低了不少。
: : 请问(1):如何在上述两项资料处理的作法取得一个平衡?正确的说,如何选
: : 择资料数的多寡来分析?
: : 请问(2):是否有一指数或是相关的理论来分析相关系数的高低与资料数的多
: : 寡间的关系?
: : ***不知道我的表达方式好不好或是我所知道的对与否,如果有错请不吝指教
: : ,希望各位统计高手能帮我解答,感谢!
: 恩 不知道我说的是不是对的 不过你讲的东西真的怪怪的
: 所以 没法回答到问题
--
一对情侣分开 1小时 对女方来说,是漫长的10小时.....
一对情侣相处10小时 对女方来说,是短短的 1小时.....
女人的心很单纯 就只是 爱
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.25.118.31