作者yaowei2010 (yaowei)
看板R_Language
标题Re: [问题] 捞资料
时间Wed Aug 20 18:28:10 2014
不好意思 让回复的大大看不懂我的问题 只好重新回一篇
gene_a Chromosome gene_start gene_end | Probe_b Chromosome2 Chr_s Chr_e
A 1 25000 50000 | a1 2 175 200
B X 1000 2000 | a2 4 600 625
C 2 0 800 | a3 1 23575 23600
| a4 X 1010 1035
| a5 1 30000 30025
我想做的是
先对Chromosome是不是在一个→再对位子→假设两者都相符,收data(不符丢掉
例如上面两data
probe a3和a5都为chromosome 1 两位子分别23575~23600及30000~30025
A gene为chromosome 1 ,其位子为25000~50000,上述a5 probe都符合其chromosome
以及gene范围,归类到gene A里的match中
我的想法是两关,第一关筛选出和gene一样的chromosome的probe
第二关比较probe的数值要落入gene的位子范围中(gene_start~gene_end)
大概是这样> <
以此类推
最後才变成
gene_a match_probe
A a5
B a4
C a1
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.129.5
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/R_Language/M.1408530493.A.512.html
1F:→ yaowei2010: 补充 Probe和gene的数值全都是numeric 08/20 18:31
2F:→ yaowei2010: 位子范围就是指start~end 08/20 18:31
3F:→ koai: 请确认 A gene 有match到 a3 吗?? 08/20 18:31
4F:→ yaowei2010: 阿 没有@@" 眼残惹 08/20 18:33
5F:→ yaowei2010: 那大大得应该是对的 谢谢指正与指教!! 08/20 18:34
※ 编辑: yaowei2010 (140.112.129.5), 08/20/2014 18:35:22
6F:→ yaowei2010: 文已修正 08/20 18:35