作者ga84831 (柯)
看板Statistics
标题[程式] stata 资料处理问题
时间Wed Feb 13 15:34:21 2019
[软体程式类别]:
ATA
[程式问题]:
资料处理
[软体熟悉度]:
新手
[问题叙述]:
我有一笔资料,如下
V1 V2
18.21 1
18.21 1
18.21 1
4.49 2
4.28 3
4.18 4
3.42 5
1.首先,资料的前五名有分数一样到部分,导致我的资料不是五笔,要怎麽样让我的资料只有前五名,不要有第四跟第五名
2.取出的五笔资料我想要的运算如下[(18.21(v2=1)-18.21)^2+ (18.21(v2=1)-18.21)^2+ (18.21(v2=1)-18.21)^2+(18.21(v2=1)-4.49(v2=2))^2+(4.49-4.28(v2=3))^2]/100
所以我的资料不需要用到第四跟第五笔,也什麽方法可以解决以上问题?
第一次po文,有冒犯的地方请各位见谅。
-----
Sent from JPTT on my iPhone
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.217.209.145
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1550043264.A.215.html
1F:推 evilove: 看不懂你要表达的 02/14 00:14
2F:→ ga84831: 就是想要留下组别内前五笔资料,不知道怎麽分组跟去除不 02/14 00:41
3F:→ ga84831: 要的资料 02/14 00:41
4F:→ ga84831: 例如 02/14 00:56
5F:→ ga84831: Code. V1. Top5 02/14 00:56
6F:→ ga84831: 1100 18.21 1 02/14 00:56
7F:→ ga84831: 1100 18.21 1 02/14 00:56
8F:→ ga84831: 1100 18.21 1 02/14 00:56
9F:→ ga84831: 1100 4.49 2 02/14 00:56
10F:→ ga84831: 1100 4.28 3 02/14 00:56
11F:→ ga84831: 1100 4.18 4 02/14 00:56
12F:→ ga84831: 1100 3.42 5 02/14 00:56
13F:→ ga84831: 在code这个变数中有1100这个组别,我要怎麽取出前五笔资 02/14 00:56
14F:→ ga84831: 料,也就是把重复数字也算入,让资料不要有top5中的4跟5 02/14 00:56
15F:→ ga84831: 。 02/14 00:56
16F:推 bearching: egen k(自己填新增的变数名称)=sum(V1.) if Top5<=3 02/14 15:29
17F:→ bearching: 如果你是用code分组来加总前三名,後面加上 ,by(code) 02/14 15:31
18F:推 evilove: 是不是其实跟top5这变项无关?code是组别,V1取前5大数字? 02/15 13:13
19F:推 evilove: 如果是的话 google 怎麽在stata里写 _n _N 02/15 13:21
21F:→ evilove: 风险是 5 6 重复 只会取到5 02/15 13:28
23F:→ ga84831: 感谢各位,我的第一个问题已经解决 02/15 14:26
24F:→ ga84831: 但我现在有第二个问题,我要给定一个公式 02/15 14:26
25F:→ ga84831: 如图片,我想要计算top5中[(1-2)^2+(2-3)^2+(3-4) 02/15 14:26
26F:→ ga84831: ^2+(4-5)^2]/100,公式里的1~5必须要带入var2的数值 02/15 14:26
27F:→ ga84831: ,请各位高手救救我! 02/15 14:26
28F:推 riirene: sort code top5 02/15 19:19
29F:→ riirene: by code: generate v3 = ((var2[_n]-var2[_n+1])^2)/100 02/15 19:19
30F:→ riirene: by code: egen v4 = total(v3) 02/15 19:19
31F:→ ga84831: 感谢E大,成功了!!! 02/15 20:28