作者windincloud (云淡风轻)
看板BioMedInfo
标题Re: [问题] 资料库中要用哪一股是怎麽定义?
时间Wed Jun 17 21:14:12 2009
※ 引述《adu (^_^)》之铭言:
: ※ 引述《windincloud (云淡风轻)》之铭言:
: : ^^^^^^^^^^^^
: : 哪样的资料? 从哪边取得?
: NCBI 人类的genome
: : ^^^^^^^^^^^^^^^^^
: : 这边你指的是? 要将序列转互补嘛?
: : 那这样应该是 A <-> T C <-> G吧~
: : 若不是的话 那请不要写 <-> 会让人起误会地~
: 对~是只互补的意思:)
: : ^^^^^^^^^^^^^^^^
: : 这边要看特性吧~ 通常是编码区GC高 非编码区不一定
: : 所有资料都是5'写至3'
: : 所以当你要丢资料请先确定序列是由5'写至3'
: : 至於互补不互补 BLAST 会帮忙判定的~
: 还是没有很了解
: 即便都是5'写到3' DNA以双股的方式存在,那究竟会挑哪一股出来表示?
: 如 http://bioinfo.cs.ccu.edu.tw/wiki/doku.php?id=transcription
: 是挑识别股还是模板股?
: 又以genome的资料来说,不同基因,被转录的可能会是双股中其中一股?
: 那在这样的情况下,又会挑哪一股上传到资料库呢?
由你文中~ 我没有办法知道你想做啥大事~
不过基本上 序列写法都是由5'写至3'
也就是说你今天不管到哪个地方下载序列下来~
最左边永远是5'不会变的
至於挑出哪股来表示
我想你应该是想说方向性问题吧~
在所有的ncbi中的资料都会标上方向性及启始与终止位置
这样你就可以了解这条序列来源是正向或反向股
举例来说~
我有条阿拉伯芥序列 APG2
http://0rz.tw/ifODr
由Genomic context中可以看到这条是反义股序列
若切换成xml来看
<Seq-interval_from>83259</Seq-interval_from>
<Seq-interval_to>85228</Seq-interval_to>
<Seq-interval_strand>
<Na-strand value="minus"/>
</Seq-interval_strand>
一定有以上资讯
在序列部份是在同义股上83259 ~ 85228
方向性为负向
而在提供出来的fasta format的话 那ncbi会很好心的帮你转成5'~ 3' 表示
假定83259 ~ 83268正向股是
atccgtcaat
那fasta给你的不会是正向股序列(因为他写法这样变成3'~5' 不合规定)
所以你看到的fasta
>APG2 83268~ 83259
attgacggat
不知以上说明可以让你了解嘛?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.138.155.196
1F:→ windincloud:补一下 若你想知道如何在NCBI注解新序列 可参考下面 06/17 21:29
3F:推 adu:谢谢w大!我的一些观念错了,现在以改正....:) 06/18 09:18