作者naieeliao (♪~~)
看板nCoV2019
标题[整理] 病毒演化系统发生树
时间Sun Apr 19 18:37:27 2020
这里只是来宣传一下这两周做的小project
https://github.com/PinguPinga/hCoV-2019-phylogenetic-analysis
从 GISAID 的资料库抓病毒定序资料
Project1 => 筛出高品质的序列
Project2 => 分析并画出树状图
Git里面有pdf档可以参考
https://i.imgur.com/rELDNzQ.png
当初看 nextstrain.org 的资料
自己简单玩了一下发现有出入 (C241T是假的,定序误差)
所以就把 GISAID 原始的序列抓来分析了
https://i.imgur.com/WhUWCF9.png
概念图
树根的原点是使用大家统一定义的参考序列,采集地点在武汉,这并不重要
真要追溯到蝙蝠,说真的,没完没了
接下来要讲故事了
https://imgur.com/kHlMZD5
一、钻石公主号
node #450 (G11083T) EPI_ISL_408481 chongqing 2020-01-18
虽然在重庆第一次检验到,但实际上很多助攻来自第一艘爆炸的钻石公主号
如果回过头仔细分析不完整的序列,G11083T 贡献全球 1/6 的上传序列 (持续降低中)
还记得钻石公主号乘客返回以色列之後被验出来的事吗? 他有 G11083T
但这是不是日本该背的锅呢?
1. 目前最盛行这个突变的地域是欧洲 (合并 G26144T)
G26144T 偏偏也有独立的点突变
2. 日本目前很少报告有这个突变 (可是日本最近爆炸,却很少上传序列)
3. 早在钻石公主号爆炸之前,重庆、香港、新加坡就有这个突变的个案了
结论是...很难讲啊 我也不清楚
https://i.imgur.com/VPX47cI.png
二、恶名昭彰的Italy
node #136 EPI_ISL_412973 italy 2020-02-20 (C3037T C14408T A23403G)
其实在他前面有出现过一个
EPI_ISL_406862 germany 2020-01-28 (C3037T A23403G)
但是德国早期很快就遏止一间公司的群聚感染了
序列重复上传笔数只有1,所以被程式筛掉了
但是义大利真的害人不浅阿,太多观光客了,一下就传到世界各处
这个分支占了 60% 以上的笔数,欧美遍地都是他的子孙
node #375 India 就是他的子孙之一
印度上传的序列过半 (9/12) 都是他,在人口世界第二的国家,应该会爆炸吧 (?)
node #1159 Russia 也是 (11/22)
看来俄罗斯要起飞了
https://i.imgur.com/no8EZUk.png
三、Make America Great Again
事实上跟义大利同时发生的,是二月下旬到三月上旬的美国分支
美国现在最大的流派还是三月初暴涨的义大利系 (美国锁国前的飞机超毒)
node #1 EPI_ISL_413456 usa 2020-02-20
C8782T C17747T A17858G C18060T T28144C
这个分支主要在北美跟澳洲出现,普遍度还是远远不及义大利的株系
https://i.imgur.com/ZMI0Qc5.png
四、日渐壮大的西班牙无敌舰队
听说最近西班牙死比较多人? 其实西班牙的资料只局限在两个支系
很抱歉,这株系比较难从大量数据中找到源头
node #409 EPI_ISL_418248 spain 2020-03-01
C8782T T9477A C14805T G25979T T28144C C28657T C28863T
智利就中奖了... 南美洲会不会都是他呢?
澳洲有一个小分支,接下来讨论
五、世界的大赢家,澳洲
当你以为纽澳离亚洲、欧洲、美洲都隔着汪洋大海时
澳洲真的各个病毒株系都有!一二月亚洲的株系、三四月的欧美株系
虽然说澳洲表面上好像趋缓,但现在他可是集大成者!
实际上我们还不清楚究竟对不同株系会不会有共同的免疫力
听说最近纽澳要形成共同的 travel bubble (往来的班机复航)
拭 目 以 待
六、盖牌专家,中国
自从三月後上传的有效资料数.... 手指数得出来
听说最近有班机,我们可以来验验看有没有新的演化支出现
结论:地理位置对於病毒的演化有很大的关系
冰岛就有很多专属的病毒株系,大英帝国也有少部分
以上是我个人的意见,解说到这边,谢谢大家 (我不是专门研究病毒的,很抱歉)
※禁止转载※
最近没投2330,失望啊....
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.169.10.133 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/nCoV2019/M.1587292651.A.060.html
※ 编辑: naieeliao (118.169.10.133 台湾), 04/19/2020 18:40:37
1F:推 warrenchen: 感谢汇整101.137.108.236 04/19 18:42
2F:→ KunioFAN: 推整理~ 125.224.99.3 04/19 18:44
3F:→ soulgem: 想到上次看到的 graphen.ai 还在画 0.0a 140.112.30.49 04/19 18:44
当我看到某些突变点都被抓出来的时候,表示他根本没有筛选掉定序的误差
当误差为 0.01% 的时候,这只病毒序列约 29k,就有3个误差罗
以误差 0.01% 拿去分析是不行的,需要用量去弥补误差
而不是把误差呈现在一张图上,看起来眼花撩乱
5F:推 james732: 推 39.10.62.205 04/19 18:48
6F:推 mesenchymal: 感谢分析 67.87.236.128 04/19 18:54
7F:推 ilccc: 感谢整理!202.133.193.204 04/19 18:56
8F:推 volkyrie: 感谢整理最近就想看看这个,那请问有台 1.160.47.69 04/19 19:02
9F:→ volkyrie: 湾病株也会像澳洲那样各地来吗? 1.160.47.69 04/19 19:02
Git里面有pdf跟txt,可以直接从 complete 搜寻 "taiwan"
长庚有一个小小的株系,至於突变出现四个我猜测是定序的误差 (primer/机器)
其他大多来自国外
10F:推 snorker: push 61.223.168.12 04/19 19:09
11F:推 silentence: 要多大变异才能排除定序的偏误呢@@?180.204.227.120 04/19 19:12
简单说,当你把特定突变全部隐藏,而资料的乱度显着下降
之前没有仔细筛的时候,发现病毒突变好快,就跟graphen那张图一样乱
可是graphen连完整度 < 2% 的序列都不放过,所谓 GIGO
12F:推 aprilsheep: 公司名称都打出来了,还甩锅,就是中 223.140.197.11 04/19 19:12
13F:→ aprilsheep: 资呀,欧洲国家买到出问题的公司都会 223.140.197.11 04/19 19:12
14F:→ aprilsheep: 报名字推推 223.140.197.11 04/19 19:12
15F:→ aprilsheep: 抱歉上方为旧推错 223.140.197.11 04/19 19:13
16F:推 becseger: 感谢专家解说! 67.148.60.28 04/19 19:19
17F:→ SRadiant: 中国从很早就开始刻意不上传序列了,不 111.82.201.234 04/19 19:29
18F:→ SRadiant: 然应该会更精采 111.82.201.234 04/19 19:29
19F:→ muskdeer: 看呒...0.0? 1.160.137.252 04/19 19:32
20F:推 k879311: 这个要看出共同免疫并不是太容易,不过这 111.243.93.128 04/19 19:43
21F:→ k879311: 个可以提供很好的防疫方向。像是台湾找 111.243.93.128 04/19 19:43
22F:→ k879311: 不出感染源的,是否已经有台湾株了? 111.243.93.128 04/19 19:43
DNA/RNA的序列不适合拿去推论蛋白质层面的东西,免疫是这部分无法分析的地方
23F:推 bunjie: 感谢分析和解说182.155.179.146 04/19 19:44
24F:→ kuma660224: 这跟免疫没有关系啦 1.200.218.175 04/19 21:07
25F:→ kuma660224: 是看病毒传往那个方向 1.200.218.175 04/19 21:07
26F:→ kuma660224: 例如台湾前期流行的都中国来源 1.200.218.175 04/19 21:08
27F:→ kuma660224: 後期来自欧美 而美国的来自欧洲 1.200.218.175 04/19 21:08
28F:推 kuma660224: 峈첑u你没守好哪个方向 1.200.218.175 04/19 21:10
29F:→ kuma660224: 源头武汉 但多数不是武汉直接去 1.200.218.175 04/19 21:11
30F:→ kuma660224: 源头还好守 猪队友才很难守 1.200.218.175 04/19 21:12
31F:推 abow0704: 好强的整理 223.138.97.30 04/19 21:15
32F:推 kennetharies: 推 111.82.149.74 04/19 21:21
33F:推 silentence: 长知识了 谢谢180.204.227.120 04/19 21:32
34F:推 clouse1234: 推 122.117.56.229 04/19 21:35
35F:推 arthurwang: 推整理 59.115.114.196 04/19 21:36
36F:推 ioupoiu: 垃圾支那 1.200.207.127 04/19 21:45
37F:推 MosDonalds: 推 49.216.169.230 04/19 21:57
38F:推 avans: 推研究 谢谢说明! 1.161.135.174 04/19 22:05
39F:推 fromwilda: 推111.242.148.127 04/19 22:39
40F:推 none024: 谢谢整理 73.43.106.240 04/19 22:44
※ 编辑: naieeliao (118.169.10.133 台湾), 04/19/2020 23:03:54
41F:推 ThomasHSNU: 推114.136.195.235 04/19 23:29
42F:推 hotanger: 有问过张教授吗? 220.136.3.41 04/20 07:33
43F:推 soulgem: 推 (果然还是有很需要领域知识的地方) 140.112.30.49 04/20 07:50
44F:推 skycat2216: 知识推 101.136.131.89 04/20 08:02
45F:推 kisscat1023: 推专业 101.10.22.248 04/20 08:28
46F:推 windfolg: 推 223.141.30.65 04/20 10:00
47F:推 joann63: 推专业! 175.180.66.131 04/20 12:38
48F:推 ausagi: 推223.136.143.163 04/20 14:51