作者love113w ()
看板Statistics
标题[问题] 鲍鱼数据问题
时间Tue Jun 13 00:01:16 2017
不好意思不知道发在此版适不适合
想请问一下,若在资料分析中,未做统计前就将变数删除合理吗?
例如UCI鲍鱼数据集
里面的性别有F,M,I(infant) 但是有些infant的年龄却很大
不知道要如何去解释它,想要把这变数拿掉
查了一些资料,发现过往的人也都没有去发现这问题...
就直接开始丢统计软体
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.162.139.21
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1497283279.A.2EC.html
1F:推 ayre: 每个变数的定义都弄清楚了吗?有时候只是蒐集资料时coding 06/13 00:58
2F:→ ayre: 方式不同 06/13 00:58
3F:→ love113w: 弄清楚了 有些婴儿年纪比男性女性大... 06/13 08:53
4F:推 ayre: 如果确定不是coding的时间单位不同,而且这些值删掉不会影响 06/13 21:24
5F:→ ayre: 其它变数的敍述统计量,删掉未必不可,但是记得在report时, 06/13 21:25
6F:→ ayre: 要清楚揭露处理资料的方式 06/13 21:26
7F:→ love113w: 谢谢 06/13 23:05