作者davdoc (davdoc)
看板Ancient
標題Re: [討論] 聖經密碼
時間Mon Jan 31 04:07:50 2005
提供一個另類的角度來思考這類的相似性問題。
身體重要的分子─蛋白質,通常由20種不同的胺
基酸形成一條或是多條長鏈組成。習慣上,生物
學家給每種胺基酸一個英文字母來表達,所以總
共用上了二十個字母。
例如:ALMCIVSFTYWQDENRPGHK
每當生物學家發現一種新的蛋白質,並且也定出
它的序列之後,通常接下來做的,會去和已知功
能的蛋白質序列做比較。目的在於,因為蛋白質
的功能和構造,與其特定序列是有關聯性的,如
果新發現的蛋白質具有和已知的蛋白類似的序列,
表示也許新的蛋白具有類似的功能和構造,這樣
有助於釐清新蛋白的角色。
通常這樣做,比對接近的蛋白後來用更精密麻煩
的方式去驗證,的確構造功能類似。
但是...
也經常發生序列看起來簡直85% 都相同了,但是
事後證明天差地遠。
因為蛋白質序列可以很長,例如數百個「字母」
甚至數千,兩個不同的蛋白總是會有一些地方不
能對上;就好比聖經也沒有把陳總統的名字給明
明白白地說出來一樣。所以都得挪移一些以對齊。
例如說:
蛋白A: ALM GS IF E TYWQ KR VI RP GG PP
||| || | |||| | || || ||
蛋白B: ALM ADEIFPERTYWQ K VI RP PP
兩個胺基酸鏈,都有22個單元,其中有17個比對
起來序列似乎相近,但是有可能這兩個蛋白質一
點關係都沒有。
比對這麼長的序列,都有可能出現這種問題,如
果只比對幾個字,又使用無母音符號的希伯來文,
把字母前後依存性也去掉了,出現相類似巧合的
機會就更高了。
一天到晚在玩DNA 分子的分子生物學家就很了解
這點,DNA 實質上等同只有四個字母排列組合,
以人類為例,基因體這本「書」,由大約三十億
個「四字母組AGCT」寫成。當分子生物學家
要找出特定基因的時候,絕對不會用太短的「搜
尋字串」去找,否則保證找出一堆不相關的。
同理,用希伯來文字母,以亂數方式排出一篇夠
長的亂數表,再用很短的子音構句去找,條件鬆
散的情況下一樣可以找出一堆符合的。
以下無關政治,但若以台灣政局為例,起碼也得
用類似「陳總統選前一天受不明槍擊,後以些微
得票率差距贏得西元2004年、中華民國九十三年
總統大選」這麼長的句子才有意義。
※ 引述《QQFIRE (QQFIRE)》之銘言:
: 預知說不定可以避免災禍。
: ※ 引述《ljs (哇里咧)》之銘言:
: : 知道了又如何?/
: : 未來很多事如果註定了
: : 知道會更痛苦吧
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 65.146.213.167
1F:推 boshun:我也覺得要能找得出敘述句子才算得上密碼 218.175.218.227 02/06