作者brasil (巴西小子)
看板BioMedInfo
标题[问题] NGS的SRA资料库
时间Tue Aug 2 01:09:18 2011
大家好~
小弟最近在研究NGS方面的问题
因为跟先前用过的资料库有点不太一样
所以有一些基本的问题想要请教各位
===========================================================================
目标是想要进一步的分析NGS所定序出来的序列
1.请问我要如何下载序列
我知道在SRA资料库下载的序列都是.sra档
刚刚稍微研究一下可以利用fastq-dump这个执行档来转换成.fastq档
假设我想要研究的主题是人类的whole genomic DNA
请问我要如何下载到这些序列
(因为我在SRA里只看的到ACCESSION number,但我不知道这些number是什麽物种)
2.在.fastq档里有一个栏位是spot,请问这是代表什麽意思?
3.在.fastq档里有很多条序列
EX:
@SRR096072.lite.sra.1 FVUWOJD02F4NLA length=255
ATCG......
+SRR096072.lite.sra.1 FVUWOJD02F4NLA length=255
FFFFFFFFFFFFFFFFFFFFFFIIIIIIIIIIIIIII...
@SRR096072.lite.sra.2 FVUWOJD02G1J77 length=290
ATCG......
+SRR096072.lite.sra.2 FVUWOJD02G1J77 length=290
FFFFFFFFFFFFFFFFFFFFFFIIIIIIIIIIIIII...
@SRR096072.lite.sra.3
.
.
@SRR096072.lite.sra.4
.
.
@SRR096072.lite.sra.5
.
.
.
请问我该如何读这些序列?
是@SRR096072.lite.sra.1 继续接 @SRR096072.lite.sra.2
继续接@SRR096072.lite.sra.3 一直下去这样吗?
抱歉问题有点多,有劳各位了!!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 111.252.100.21