作者davdoc (davdoc)
看板Ancient
标题Re: [讨论] 圣经密码
时间Mon Jan 31 04:07:50 2005
提供一个另类的角度来思考这类的相似性问题。
身体重要的分子─蛋白质,通常由20种不同的胺
基酸形成一条或是多条长链组成。习惯上,生物
学家给每种胺基酸一个英文字母来表达,所以总
共用上了二十个字母。
例如:ALMCIVSFTYWQDENRPGHK
每当生物学家发现一种新的蛋白质,并且也定出
它的序列之後,通常接下来做的,会去和已知功
能的蛋白质序列做比较。目的在於,因为蛋白质
的功能和构造,与其特定序列是有关联性的,如
果新发现的蛋白质具有和已知的蛋白类似的序列,
表示也许新的蛋白具有类似的功能和构造,这样
有助於厘清新蛋白的角色。
通常这样做,比对接近的蛋白後来用更精密麻烦
的方式去验证,的确构造功能类似。
但是...
也经常发生序列看起来简直85% 都相同了,但是
事後证明天差地远。
因为蛋白质序列可以很长,例如数百个「字母」
甚至数千,两个不同的蛋白总是会有一些地方不
能对上;就好比圣经也没有把陈总统的名字给明
明白白地说出来一样。所以都得挪移一些以对齐。
例如说:
蛋白A: ALM GS IF E TYWQ KR VI RP GG PP
||| || | |||| | || || ||
蛋白B: ALM ADEIFPERTYWQ K VI RP PP
两个胺基酸链,都有22个单元,其中有17个比对
起来序列似乎相近,但是有可能这两个蛋白质一
点关系都没有。
比对这麽长的序列,都有可能出现这种问题,如
果只比对几个字,又使用无母音符号的希伯来文,
把字母前後依存性也去掉了,出现相类似巧合的
机会就更高了。
一天到晚在玩DNA 分子的分子生物学家就很了解
这点,DNA 实质上等同只有四个字母排列组合,
以人类为例,基因体这本「书」,由大约三十亿
个「四字母组AGCT」写成。当分子生物学家
要找出特定基因的时候,绝对不会用太短的「搜
寻字串」去找,否则保证找出一堆不相关的。
同理,用希伯来文字母,以乱数方式排出一篇够
长的乱数表,再用很短的子音构句去找,条件松
散的情况下一样可以找出一堆符合的。
以下无关政治,但若以台湾政局为例,起码也得
用类似「陈总统选前一天受不明枪击,後以些微
得票率差距赢得西元2004年、中华民国九十三年
总统大选」这麽长的句子才有意义。
※ 引述《QQFIRE (QQFIRE)》之铭言:
: 预知说不定可以避免灾祸。
: ※ 引述《ljs (哇里咧)》之铭言:
: : 知道了又如何?/
: : 未来很多事如果注定了
: : 知道会更痛苦吧
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 65.146.213.167
1F:推 boshun:我也觉得要能找得出叙述句子才算得上密码 218.175.218.227 02/06