作者ga84831 (柯)
看板Statistics
標題[程式] stata 資料處理問題
時間Wed Feb 13 15:34:21 2019
[軟體程式類別]:
ATA
[程式問題]:
資料處理
[軟體熟悉度]:
新手
[問題敘述]:
我有一筆資料,如下
V1 V2
18.21 1
18.21 1
18.21 1
4.49 2
4.28 3
4.18 4
3.42 5
1.首先,資料的前五名有分數一樣到部分,導致我的資料不是五筆,要怎麼樣讓我的資料只有前五名,不要有第四跟第五名
2.取出的五筆資料我想要的運算如下[(18.21(v2=1)-18.21)^2+ (18.21(v2=1)-18.21)^2+ (18.21(v2=1)-18.21)^2+(18.21(v2=1)-4.49(v2=2))^2+(4.49-4.28(v2=3))^2]/100
所以我的資料不需要用到第四跟第五筆,也什麼方法可以解決以上問題?
第一次po文,有冒犯的地方請各位見諒。
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.217.209.145
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1550043264.A.215.html
1F:推 evilove: 看不懂你要表達的 02/14 00:14
2F:→ ga84831: 就是想要留下組別內前五筆資料,不知道怎麼分組跟去除不 02/14 00:41
3F:→ ga84831: 要的資料 02/14 00:41
4F:→ ga84831: 例如 02/14 00:56
5F:→ ga84831: Code. V1. Top5 02/14 00:56
6F:→ ga84831: 1100 18.21 1 02/14 00:56
7F:→ ga84831: 1100 18.21 1 02/14 00:56
8F:→ ga84831: 1100 18.21 1 02/14 00:56
9F:→ ga84831: 1100 4.49 2 02/14 00:56
10F:→ ga84831: 1100 4.28 3 02/14 00:56
11F:→ ga84831: 1100 4.18 4 02/14 00:56
12F:→ ga84831: 1100 3.42 5 02/14 00:56
13F:→ ga84831: 在code這個變數中有1100這個組別,我要怎麼取出前五筆資 02/14 00:56
14F:→ ga84831: 料,也就是把重複數字也算入,讓資料不要有top5中的4跟5 02/14 00:56
15F:→ ga84831: 。 02/14 00:56
16F:推 bearching: egen k(自己填新增的變數名稱)=sum(V1.) if Top5<=3 02/14 15:29
17F:→ bearching: 如果你是用code分組來加總前三名,後面加上 ,by(code) 02/14 15:31
18F:推 evilove: 是不是其實跟top5這變項無關?code是組別,V1取前5大數字? 02/15 13:13
19F:推 evilove: 如果是的話 google 怎麼在stata裡寫 _n _N 02/15 13:21
21F:→ evilove: 風險是 5 6 重複 只會取到5 02/15 13:28
23F:→ ga84831: 感謝各位,我的第一個問題已經解決 02/15 14:26
24F:→ ga84831: 但我現在有第二個問題,我要給定一個公式 02/15 14:26
25F:→ ga84831: 如圖片,我想要計算top5中[(1-2)^2+(2-3)^2+(3-4) 02/15 14:26
26F:→ ga84831: ^2+(4-5)^2]/100,公式裡的1~5必須要帶入var2的數值 02/15 14:26
27F:→ ga84831: ,請各位高手救救我! 02/15 14:26
28F:推 riirene: sort code top5 02/15 19:19
29F:→ riirene: by code: generate v3 = ((var2[_n]-var2[_n+1])^2)/100 02/15 19:19
30F:→ riirene: by code: egen v4 = total(v3) 02/15 19:19
31F:→ ga84831: 感謝E大,成功了!!! 02/15 20:28