作者gsuper (Logit(odds))
看板BioMedInfo
標題[問題] 如何把全部 GEO 中某 GPL 的全樣本抓回?
時間Mon Aug 20 23:38:18 2012
我需要抓 GPL10558 (illumina HumnaHT-12) 的全樣本
http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL10558
內部有 3000 多片分散在 133 個 GSE 內
請問有沒有方法能直接下載
還是要靠各種 tricky 方式處理? (parser , wget .....0rz)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.247
1F:推 hajimels:印象中沒有 08/21 03:00
2F:→ hajimels:把GSEXXX從網頁pasre下來,然後用wget去fetch ftp比較快 08/21 03:01
3F:→ hajimels:不過小心各實驗normalization的方法有所出入 08/21 03:01
4F:推 stillcat:請問下載的檔名有沒有規律或是能知道,如果檔案名知道 08/21 08:55
5F:→ stillcat:下載的 URL 都把他列出來, 把他放在一 HTML 檔案中,就可 08/21 08:56
6F:→ stillcat:用軟體一次批次下載 08/21 08:57
7F:→ gsuper:果然是跟我想的一樣要靠 parser + wget 08/23 16:56
8F:→ gsuper:鬱悶 08/23 16:57
9F:推 lingon:寫個perl script 去抓就好 08/23 21:25
10F:推 huggie:R 的 GEOQuery 行嗎? 08/24 17:34