作者Hsuanly (LW)
看板PH-90
标题[公告]卫生资讯作业
时间Wed May 26 12:43:03 2004
【请同学利用dps软体依附件实作习题,并於下周课前mail给老师】
Disease Prediction System习题
环境设定
设定参考名称 wtrial 指定至 c:\dps\wtrial
dps 指定至 c:\dps
1.请合并wtrial参考名称中tx1, tx2 二个dataset,使用ID variable为sort variable,
并将结果存入tx12档案中,总笔数为 ___________。 (Merge)
2.请将text12档案中(下述於c:\dps\wtrial\record.pro.doc档案中有范例,可直接复制
、贴上) ,并将最後结果存於tx_reco档案。
完成 是 ___ 否 ___ (Recode/Compute)
(1)nodes变项之值 -1 改为missing(.),
if nodes=-1 then nodes=.;
(2)size变项值分六组,编码後之值存存肿瘤大小细分变项(sizegp)中
sizegp=0;
if size=-1 then sizegp=.;
else if size>=0 and size<=9 then sizegp=0;
else if size>=10 and size<=14 then sizegp=2;
else if size>=15 and size<=19 then sizegp=3;
else if size>=20 and size<=29 then sizegp=4;
else if size>=30 and size<=49 then sizegp=5;
else if size>=50 then sizegp=6;
(3)请将淋巴侵袭(nodes)、肿瘤大小细分(sigegp)及组织分化(grade)变项产生虚拟变
项(dummy variable)。 (Recode/Compute)
n1=0; n2=0;
if nodes=1 then n1=1;
if nodes=2 then n2=1;
if nodes=. then
do; n1=.; n2=.; end;
g3=0; g2=0;
if grade=2 then g2=1;
if grade=3 then g3=1;
if grade=. then
do; g2=.; g3=.; end;
dsize0=0; dsize2=0; dsize3=0;
dsize4=0; dsize5=0; dsize6=0;
if sizegp=0 then dsize0=1;
if sizegp=2 then dsize2=1;
if sizegp=3 then dsize3=1;
if sizegp=4 then dsize4=1;
if sizegp=5 then dsize5=1;
if sizegp=6 then dsize6=1;
if sizegp=. then do;
dsize0=.; dsize2=.; dsize3=.; dsize4=.;
dsize5=.; dsize6=.; end;
3.请随机抽样(simple random sampling) 100笔tx_reco档案之资料,将抽样资料存入
tx_reco100档案中。
完成 是 ___ 否 ___ (Sampling)
下列题目请使用 wtrial.txsurv资料档
4.请利用逻辑式回归分析,自变项为 n1, n2, g2, g3, dsize0, dsize2, dsize3,
dsize4, dsize5, dsize6, 依变项为 bi_causeod,(实验组请将模式储存於
wtrial.model.tx_logi中),以评估肿瘤大小、淋巴侵袭及组织分化对死亡的影响,
请写出下列回归系数
n1 _______, n2________ 。 (Model Selection)
g2 _______, g3________
5.利用上述之逻辑式?归分析请求出 (Model Verification/Diagnostic)
(1)Overdispension 之prob chisq值 ____________
(2)以hat matrix(H) check Outlier之值中,其值在0.06以上有几个个案数 _______
(3)机率在0.4为标准之敏感度及精确度 ________ _________
(Classification table)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.120.83
※ 编辑: Hsuanly 来自: 140.112.120.83 (05/26 13:35)