作者windincloud (云淡风轻)
看板BioMedInfo
标题Re: [问题] 请问版上高手 蛋白质预测的问题
时间Mon Jun 16 19:12:52 2008
※ 引述《liturtle (超屌师大附友会)》之铭言:
: 原文恕删~~~
: 我想我的疑问没有被解答
: 就直接回文来讨论一下吧
: 我这边认为的蛋白质预测
: 是指 丢入蛋白质的胺基酸序列给软体
: "预测"出他的"三级"结构
: 那麽如果是一开始就有PDB档 就代表他的结构已经被解出
: 打开里面就可以看到坐标
: 丢到类似PYMOL 或是 CHIME 之类的软体 即可以"秀出"结构立体图
: 但这些都不是"预测"吧 因为结构都已经解出来 座标都被标定了 怎样能算是预测?
: 另外DSSP我知道
: 我们做的结构比对软体基本上就是利用他来做training
: 不过这个程式也是需要PDB档 这样也不算是预测吧
: 最後
: 我当然了解二级结构需要被预测
: 但我指的是 现在要算出二级的软体很多
: 但是要"预测"出"三级结构"的其实几乎没有
: PS.以上问题 都要在我们认为的"预测"定义相同 才可以成立
嗯~ 我可能讲的不够清楚
其实这边预测的的确确是可以做到给定一未知protein 然後预测出其二级结构
我所提的方法只是所谓建立一个model
而model的建立当然是由一个已知的资讯才能建立
所谓用machine learing的方式是说
我提供属性及答案给机器让他像人一样去学习
当学习後机器会根据他所学到的知识建立一个model
然後就可以将你想要得知protein "二级结构"的样子预测出来
这边要特别要说的是因为属性给的不一样(可能会有物化属性等等)
所以刚刚有回文提到homology modeling 我想可能会有些许的差异才对
不过基本上还是建立model然後根据model再来预测
再来L大所提到三级结构预测
这目前真的很难用电脑计算去得知
所以要是L大将预测定义是预测出给定一条未知protein序列得到其三级结构
那就比较没法
但是要是要是forcus在二级结构则是可以的
--
通常我们称"预测"时都会说明是预测是啥问题
所以看到预测蛋白质结构时我会直觉是预测蛋白质二结构(上课被荼毒太久的直觉反应)
这边要跟L大说声不好意思
--
最近有看到所谓预测 β-barrel protein 的问题
因为β-barrel protein样子比较固定
http://www.biologie.uni-konstanz.de/folding/Structure%20gallery%201.html
所以有人也会提高β-strain的预测甚至预测出其是anti-parallel或是parallel
这样可以画出预测的β-barrel protein三级结构
不知这样可以算预测出三级结构吗? XD
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.138.155.216
1F:推 liturtle:收到 我了解了 XD 话说後来丢的那个网址好有趣 感谢啦~ 06/16 19:57
2F:推 nightcatman:你现在用的machine learning是哪一种呢? 据我所知目前 06/16 20:13
3F:→ nightcatman:结构上好像是以rule-based比较多 06/16 20:13
4F:→ nightcatman:不过我很久没碰这块了 也许资讯不够新 06/16 20:14
5F:→ hgsfhevil:其实,也是有软体,可以根据序列资讯去预测二级结构 06/16 21:03
6F:→ hgsfhevil:但是,如果考虑到实验验证性,pdb是一个不错选择 06/16 21:05
7F:→ hgsfhevil:目前,要预测三级结构,通常还是利用预测软体去预测 06/16 21:06
8F:→ hgsfhevil:三级结构的答案,之後,再用二级结构当属性去预测 06/16 21:07
9F:推 masamonster:ML似乎有点被过份利用了~ 毕竟他还是只能学习到已知 06/16 22:37
10F:→ masamonster:的资讯,当一个未知的资讯进入後,这个model效果 06/16 22:38
11F:→ masamonster:就会没有预测已知的好~ 06/16 22:38
12F:→ hgsfhevil:因此,也造成很多生物学家不相信ML预测出来的结果 06/16 23:01
13F:推 masamonster:其实很多资讯学家也不相信ML的结果 :p 06/17 00:56
14F:推 nightcatman:不相信+1 以前越做越心虚,最後受不了就跳离这领域 06/17 01:42
15F:→ windincloud:其实也没啥心不心虚的问题 只是属性怎加怎玩 让人匪夷 06/17 16:10
16F:→ windincloud:所思 不过基本上原理还是基於统计理论 不至於全不可信 06/17 16:11
17F:推 masamonster:嗯嗯,ML还是有其理论,只是谨慎使用才能达到目的 06/17 18:24
18F:→ masamonster:而不是什麽都要靠ML~ 06/17 18:24
19F:→ hgsfhevil:回到一个重点,生物背景要充实,会导致一堆人不信任ML 06/17 19:05
20F:→ hgsfhevil:不是它不好,而是大部分ML的人,几乎是没有依据的 06/17 19:07
21F:→ hgsfhevil:加上属性,导致可信度很低,最初使用ML的人,考虑很详细 06/17 19:08
22F:→ hgsfhevil:因此,几乎每篇评价不低,但是後来,一堆人乱搞,结果就... 06/17 19:09