作者hgsfhevil (evil)
看板BioMedInfo
標題Re: [討論] 預測ESEs的方式
時間Tue Jun 3 17:59:45 2008
※ 引述《realism ()》之銘言:
: 發現大家可能不懂我的意思 跟我朋友要了paper給大家參考:
: http://www.biomedcentral.com/1471-2105/8/159
: ※ 引述《realism ()》之銘言:
: : 前幾天有個朋友問我關於預測ESEs(Exonic Splicing Enhancer)的問題
: : 他說他使用統計的方法來預測 我查了ㄧ下文獻 似乎是因為ESE通常很短
: : 要用pattern來預測不是很能夠取信於人 所以會加上統計的方式
: : 預測的方式大概是這樣:
: : 找出某一個hexamer(已知的幾個ESEs)在水稻的exon的頻率明顯高於intron
: : 並且在exon weak splice site的頻率高於在eoxn strong splice site的頻率
: : 找出來的hexamer即認定為新的ESEs
: : 但是做出來的結果預測出相對於參考文獻 異常高量的ESE
: : 我想了想可能跟物種不同 intron的長度
: : 與多寡有關係 因為這樣統計的基本條件就已經不同了
: : 請問該怎麼解決這種差異呢??
大家好,這是我朋友幫我問的,我是做這個題目的人
問題在於預測出來的候選ESE序列數量多
我想要利用已知水稻序列資訊讓我了解問題所在
例如:我試著分析,exon,intron 序列核甘酸組成,
已經知道intron AT比率高(0.64),CG比率低(0.36),exon中AT=0.53 cg=0.46
大家可以提供給我一下日本水稻exon,intron明顯不一樣的資訊嗎?
我需要的是這方面的建議,可以幫助我釐清問題所在
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.138.155.220
1F:推 auymle:我不懂的是你要去找exon與intron sequence content的差異 06/03 18:23
2F:→ auymle:然後來推翻說你這個方法不可行嗎?? 06/03 18:23
3F:推 huggie:你在本身在做預測方法?然後想知道如何預測更準? 06/03 18:30
4F:推 nightcatman:回一樓 我想他只是要一個參數模版,好套進像HMM之類的 06/03 23:15
5F:→ nightcatman:演算法去training,再拿去預測他真正要做的東西 06/03 23:16
6F:推 nightcatman:看完paper發現是LSVM不是HMM, 不過概念類似都是ML相關 06/03 23:43