作者gsuper (Logit(odds))
看板BioMedInfo
标题[问题] 如何把全部 GEO 中某 GPL 的全样本抓回?
时间Mon Aug 20 23:38:18 2012
我需要抓 GPL10558 (illumina HumnaHT-12) 的全样本
http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL10558
内部有 3000 多片分散在 133 个 GSE 内
请问有没有方法能直接下载
还是要靠各种 tricky 方式处理? (parser , wget .....0rz)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.239.247
1F:推 hajimels:印象中没有 08/21 03:00
2F:→ hajimels:把GSEXXX从网页pasre下来,然後用wget去fetch ftp比较快 08/21 03:01
3F:→ hajimels:不过小心各实验normalization的方法有所出入 08/21 03:01
4F:推 stillcat:请问下载的档名有没有规律或是能知道,如果档案名知道 08/21 08:55
5F:→ stillcat:下载的 URL 都把他列出来, 把他放在一 HTML 档案中,就可 08/21 08:56
6F:→ stillcat:用软体一次批次下载 08/21 08:57
7F:→ gsuper:果然是跟我想的一样要靠 parser + wget 08/23 16:56
8F:→ gsuper:郁闷 08/23 16:57
9F:推 lingon:写个perl script 去抓就好 08/23 21:25
10F:推 huggie:R 的 GEOQuery 行吗? 08/24 17:34