作者piggood (成為有品味的男人)
看板Statistics
標題Re: [統計] 回歸分析
時間Mon Mar 6 17:56:15 2006
※ 引述《scamilla (..)》之銘言:
: ※ [本文轉錄自 Math 看板]
: 作者: scamilla (..) 看板: Math
: 標題: [統計] 回歸分析
: 時間: Mon Mar 6 01:29:24 2006
: 已知一X、Y分布圖,欲以線性迴歸分析其趨勢
: 1. 若所選取資料數較少時,各筆資料差異性較小,因此相關係數較大,
: 不過也因為所選取資料數佔整體資料數的比例較小,因此利用這些所選取出
: 來的資料表現線性迴歸的趨勢似乎較不完整。
: 2. 若所選取資料數較多時,各筆資料差異性較大,因此相關係數較小,不過
: 也因為所選取資料數佔整體資料數的比例較大,因此利用這些所選取出來
: 的資料表現線性迴歸的趨勢似乎較資料數較少時完整。
: 就資料處理的觀念,相關係數似乎可以當作是線性迴歸結果正確性與否的
: 指標,若相關係數越高,則代表各筆資料相當符合曲線;而就抽取樣本來
: 說,所抽取樣本的比例越高,越能符合事件所代表的意義,也就是說若把
: 大部分的資料都列入觀察,那麼所觀察到的也近乎最初的X、Y散佈。
: 以上兩者各有優缺點又互相矛盾,舉極端為例,若取兩筆資料作線性
: 迴歸,相關係數當然為1,不過所呈現出來的趨勢正確性如何?應該是
: 低到不可信吧!?若取全部的資料作線性迴歸,所呈現的趨勢不論好
: 壞,都是完成的呈現這個事件,不過相關係數卻也降低了不少。
: 請問(1):如何在上述兩項資料處理的作法取得一個平衡?正確的說,如何選
: 擇資料數的多寡來分析?
你的「整體資料數」是指你的整個樣本數還是母群體??
如果是樣本數的話,當然是全下啦~~~不過最好是經過樣本數的估計步驟
如果是母群體的話,也是全下,就做普查吧~~
如果全下後相關會低是因為真實情形就是如此(如果抽樣沒問題的話)
想要相關高,而去挑選樣本,簡單說就是假的結果
: 請問(2):是否有一指數或是相關的理論來分析相關係數的高低與資料數的多
: 寡間的關係?
做檢定吧~~~
簡單迴歸的話就 檢定r 或是 檢定斜率 皆可
檢定就會考慮樣本數的大小了
樣本小比較不容易通過檢定,就算他的r接近1
或是求r的95信賴區間,相信樣本大的信賴區間會較窄
: ***不知道我的表達方式好不好或是我所知道的對與否,如果有錯請不吝指教
: ,希望各位統計高手能幫我解答,感謝!
我想我應該是沒有看錯你要問的
希望有回答到
一點淺見
謝謝
--
大人總是喜歡提一些我們小時候的事,而且說了幾百遍也不膩………
知道為什麼嗎?
因為這是他們唯一可以表示跟我們關係還是很親密的方式…………
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.25.118.31