作者love113w ()
看板Statistics
標題[問題] 鮑魚數據問題
時間Tue Jun 13 00:01:16 2017
不好意思不知道發在此版適不適合
想請問一下,若在資料分析中,未做統計前就將變數刪除合理嗎?
例如UCI鮑魚數據集
裡面的性別有F,M,I(infant) 但是有些infant的年齡卻很大
不知道要如何去解釋它,想要把這變數拿掉
查了一些資料,發現過往的人也都沒有去發現這問題...
就直接開始丟統計軟體
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.162.139.21
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1497283279.A.2EC.html
1F:推 ayre: 每個變數的定義都弄清楚了嗎?有時候只是蒐集資料時coding 06/13 00:58
2F:→ ayre: 方式不同 06/13 00:58
3F:→ love113w: 弄清楚了 有些嬰兒年紀比男性女性大... 06/13 08:53
4F:推 ayre: 如果確定不是coding的時間單位不同,而且這些值刪掉不會影響 06/13 21:24
5F:→ ayre: 其它變數的敍述統計量,刪掉未必不可,但是記得在report時, 06/13 21:25
6F:→ ayre: 要清楚揭露處理資料的方式 06/13 21:26
7F:→ love113w: 謝謝 06/13 23:05