作者adu (^_^)
看板BioMedInfo
标题[问题] EST的资料
时间Fri May 15 10:10:20 2009
请问版友,我想要撷取EST中,两端UTR的序列
於是从NCBI抓了全部unigene的档案
ftp://ftp.ncbi.nih.gov/repository/UniGene/Homo_sapiens/
里面有两个600mb跟900mb(後者还没解压缩)档案我开不起来>"<(2G的小笔电)
想请问我在这边找EST两端的UTR资料正确吗...?
如果是对的,我会想办法生出电脑...
谢谢版友的回应:)
--
37m﹡
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.25.86
1F:→ hgsfhevil:可是你有什麽办法告诉别人,est两端的部分是utr? 05/15 10:58
2F:→ hgsfhevil:你大概是用start codon和stop codon去找吧,但是我比较 05/15 10:59
3F:→ hgsfhevil:建议,直接从基因体序列的注解去找utr部分,我没试过用此 05/15 11:01
4F:→ hgsfhevil:法,所以我无法判断对错,但是我感觉你这样去做,好像是ORF 05/15 11:02
5F:→ hgsfhevil:可是orf也不是找utr的方法,so 交给其他专家解答吧 05/15 11:02
6F:推 huggie:如果我跟 hajimels 版友没有学错的话,Biomart 可以找 05/15 11:27
7F:→ huggie:参考第50篇,然後attribute部份改选 5' 跟 3' UTR 05/15 11:28
8F:推 huggie:至於开大档案,电脑不是问题,是要有能看档案部份的工具 05/15 11:36
10F:→ huggie:不过要会用命令列 05/15 11:38
11F:→ adu:嗯恩 谢谢版大的回答,我主要是要先看看file里面的资料型态 05/15 16:41
12F:→ adu:是不是序列,再思考下一部该怎麽完成:) 05/15 16:42
13F:→ windincloud:EXT还是要先做orf的比对後才会知道哪边是utr 05/15 20:42
14F:→ windincloud:建议是由人类gene model中标记出有实验证的gene 去抓 05/15 20:44
15F:→ windincloud:会较为准确,且话说许多utr都是推论出来的结果 05/15 20:45
16F:→ windincloud:我第一行打错 是est :p 05/15 20:46
17F:→ adu:谢谢版大们的协助,终於解决了:D 05/19 11:55
18F:→ huggie:所以请问你最後怎麽做呀? 05/19 13:45
19F:→ adu:我没有去避免掉coding的部分..是直接抓cDNA的资料 05/20 00:44
20F:→ adu:之前会想避免是因为我想的方法不适用在coding的部分, 05/20 00:45
21F:→ adu:所以想要把coding的部分去掉。不过现在先做做看全部的cDNA... 05/20 00:45
22F:→ adu:资料我是从NCBI->EST->Search for full length cDNAs 05/20 00:48
24F:→ adu:去抓homo sapiens completely cDNA的序列。(27675笔) 05/20 00:50