作者lapavoni (lapavoni)
看板R_Language
标题[问题] t检定之t值相同p值不同问题请益
时间Mon Jun 1 10:33:53 2015
文章分类提示:
- 问题: 当你想要问问题时,请使用这个类别
[问题类型]:
经验谘询(我觉得我的t检定是不是出问题了...)
[软体熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
目前在处理一份问卷分析,受试者目前依性别分为两个Group(两组人数不同),
题目作答类型为五点计分,其中有两题的t检定跑出来的结果t值都是-2.0,但
是两个p值差很多,一个有显着,另一个则没有,还有它df的算法我也不太懂...
[程式范例]:
======================================================================
第八题的两组作答资料为:
> gb8
[1] 4 3 2 2 4 3 4 3 3 2 3 4 2 1 4 2 3 4 2 3 1 2 3 3 4 3 2 2 2 3 2 2 3 3 2 2 1 3 4 4 3 3 4 3 4 3 3 2 3 4 3 3 2 4 4 4 3 3 3 4 2 4 3 2 2 2 3 2 3
[70] 3 3 2 3 3 3 4 2 3 4 3 4 3 3 3 3 3 3 2 3 3 4 3 3 3 4 2 3 2 4 2 3 3 3 4 4 4 3 2 3 3 3 3 3 2 3 3 3 3 3 3 3 3 2 3 3 3 1 4 2 3 3 3 3 3 3 2 2 3
[139] 4 2 2 3 2 1 2 3 2 3 2 4 2 2 3 3 2 3 3 3 4 2 4 1 3 3 3 1 3 3 3 3 2 3 2 3 3 4 3 3 4 3 3 3 3 4 3 2 3 3 3 3 2 4 3 3 3 3 3 3 2 3 3 3 3 2 2 3 4
[208] 3 3 2 2 2 1 1 4 2 3 4 2 3 2 3 4 3 2 3 3 4 3 2 3 3 3 4 2 2 3 2 3 3 3 4 4 3 3 3 3 1 2 3 3 3 3 4 4 3 3 3 3 3 3 3 4 2 3 3 3 4 3 2 3 3 3 3 3 3
[277] 3 2 3 3 3 3 3 3 3 3 4 2 2 3 3 4 3 3 3 3 4 3 3 2 4 3 2 2 2 3 3 4 3 4 3 2 1 1 3 3 3 1 3 3 3 3 2 3 3 3 2 3 4 4 4 4 3 3 4 4 3 2 1 3 3 4 3 3 3
[346] 3 3 3 3 2 4 4 3 3 3 4 3 3 3 3 3 2 3 3 1 3 3 3 3 3 3 3 3 2 2 3 4 3 2 3 4 3 3 3 2 3 3 3 3 3 3 3 3 2 3 4 3 4 2 4 4 3 2 3 3 3 3 2 3 2 2 4 2 3
[415] 3 4 4 4 3 3 3 3 3 2 4 3 4 3 3 3 4 4 4 3 3 3 2 3 3 3 2
> sb8
[1] 3 2 2 3 3 3 3 3 3 3 3 3 2 3 4 3 4 2 3 3 4 4 2 3 4 3 3 3 2 2 2 3 3 4 2 4 3 3 3 3 3 2 3 4 3 3 4 4 4 3 3 3 2 3 4 3 3 4 3 4 3 4 3 2 3 3 3 3 3
[70] 3 3 2 3 3 3 2 3 3 3 4 3 3 3
t检定的结果为(两组变异数有显着差异)
> t.test(gb8,sb8,var.equal = FALSE)
Welch Two Sample t-test
data: gb8 and sb8
t = -2, df = 100, p-value = 0.1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.2691 0.0259
sample estimates:
mean of x mean of y
2.90 3.02
=========================================================================
第9题的两组资料为
> gb9
[1] 4 3 2 2 3 3 4 3 3 2 3 4 2 1 3 2 4 4 2 3 2 3 3 3 3 2 3 2 2 3 2 3 3 3 2 1 1 3 3 4 3 3 3 3 4 3 3 2 3 3 3 3 3 4 3 4 3 3 3 2 2 4 3 2 2 2 2 4 2
[70] 3 3 2 3 2 3 4 2 3 3 3 4 3 3 3 3 3 3 2 3 3 4 3 3 3 4 2 3 2 3 3 3 3 2 4 4 4 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 2 3 3 1 4 2 3 3 3 3 3 3 2 2 3
[139] 4 2 2 3 2 2 2 2 3 4 3 4 2 2 3 3 2 3 3 3 4 2 4 1 3 2 2 2 3 3 3 2 2 3 2 3 3 4 3 3 4 3 3 3 3 4 4 2 3 3 3 3 2 3 3 3 2 3 3 3 2 3 4 3 3 2 2 3 3
[208] 3 3 2 2 2 3 2 3 2 3 3 2 3 2 3 3 3 3 3 3 4 3 2 3 3 3 4 3 3 2 2 3 3 3 4 4 3 3 3 3 2 3 3 3 2 3 4 4 4 2 4 2 3 3 2 4 3 3 3 2 4 3 3 4 3 3 3 2 2
[277] 3 2 2 3 3 3 3 3 3 3 3 3 2 3 3 4 3 3 2 3 4 3 2 3 4 3 2 3 2 3 3 4 3 3 3 2 1 2 3 3 3 1 3 3 3 2 2 3 3 3 2 3 4 4 4 4 3 3 4 3 3 2 3 3 3 4 3 3 4
[346] 3 3 3 3 2 3 4 3 3 4 2 3 3 3 3 3 2 3 3 1 2 3 2 3 3 3 3 3 2 2 3 4 3 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3 3 3 4 2 3 4 2 2 3 3 2 3 2 3 2 2 4 3 3
[415] 3 4 3 4 3 3 3 3 3 3 3 3 4 3 3 3 4 4 3 3 3 3 2 3 3 3 2
> sb9
[1] 3 2 3 2 3 3 3 3 4 3 2 3 3 3 4 3 4 2 3 3 4 4 2 3 3 3 4 3 2 3 3 3 3 4 3 4 3 3 3 3 3 3 3 4 3 3 4 3 2 3 3 3 2 2 4 3 3 4 3 4 3 4 2 2 3 3 3 3 3
[70] 3 3 3 3 3 3 2 3 3 3 4 3 3 3
t检定结果为
> t.test(gb9,sb9,var.equal = FALSE)
Welch Two Sample t-test
data: gb9 and sb9
t = -2, df = 100, p-value = 0.02
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.3043 -0.0265
sample estimates:
mean of x mean of y
2.87 3.04
=======================================================================
想请问一下,我该如何解释这样的结果,一般状况下p值不是由t值和df值推出来的吗?
另,那个df=100又是如何算出来的呢?
[环境叙述]:
R version 3.2.0 (2015-04-16)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.9.5 (Mavericks)
locale:
[1] zh_TW.UTF-8/zh_TW.UTF-8/zh_TW.UTF-8/C/zh_TW.UTF-8/zh_TW.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] epicalc_2.15.1.0 nnet_7.3-9 MASS_7.3-40 survival_2.38-1 foreign_0.8-63 gplots_2.16.0 plyr_1.8.2 reshape2_1.4.1
[9] xlsx_0.5.7 xlsxjars_0.6.1 rJava_0.9-6 ggplot2_1.0.1 questionr_0.4.3
loaded via a namespace (and not attached):
[1] Rcpp_0.11.5 highr_0.5 bitops_1.0-6 class_7.3-12 tools_3.2.0 digest_0.6.8 gtable_0.1.2
[8] shiny_0.11.1 proto_0.3-10 e1071_1.6-4 stringr_0.6.2 gtools_3.4.2 caTools_1.17.1 classInt_0.1-22
[15] grid_3.2.0 R6_2.0.1 RJSONIO_1.3-0 gdata_2.16.1 scales_0.2.4 htmltools_0.2.6 splines_3.2.0
[22] mime_0.3 xtable_1.7-4 colorspace_1.2-6 httpuv_1.3.2 KernSmooth_2.23-14 munsell_0.4.2
>
[关键字]: t-test
选择性,也许未来有用
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 218.161.100.37
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1433126035.A.1F3.html
※ 编辑: lapavoni (218.161.100.37), 06/01/2015 10:36:09
1F:推 allen1985: 自由度不一样? Google 一下公式 06/01 12:22
2F:→ b10009047: 自由度的部分, google t-test wiki中有个变异数不相等 06/01 12:24
3F:→ b10009047: 的情况下, 有个公式用来算自由度的, 可能是那个 06/01 12:25
4F:→ b10009047: p.value由定义看若检定统计量和自由度一样, 应该要相等 06/01 12:31
5F:→ b10009047: 唯一想的到的只有t值後面小数点是不是被舍去了 06/01 12:32
6F:推 allen1985: 自由度一样 刚刚没仔细看完 可以upload你的data吗 06/01 12:39
7F:→ allen1985: By the way 这资料可能不太适合用t-test 06/01 12:41
8F:→ andrew43: t.test(...)$statistic 看看t值是不是相同。 06/01 14:06
9F:推 allen1985: t值 跟 df值(此条件下) 没有特别设定 通常不会是整数 06/01 14:44
10F:→ lapavoni: 先感谢各楼回答,手机回应有些限制,回家後以电脑完整回 06/01 15:58
11F:→ lapavoni: 覆 06/01 15:58
12F:→ lapavoni: 经由b10009047,allen1985两位的提示,原PO再回家检查 06/01 23:22
13F:→ lapavoni: 了一次程式,证实是很前面的小数点控制影响到t值, 06/01 23:23
14F:→ lapavoni: 造成大家的困扰,原PO在此谢罪 XD 06/01 23:25