西西河

主题:寰球同此凉热 -- 本嘉明

共:💬464 🌺2973 🌵33
全看分页树展 · 主题 跟帖
家园 感谢本兄的回复

先花,几点讨论供商榷。

1)武汉病毒和舟山病毒的差异

根据你引用帖子里的方法,我先在NCBI对武汉肺炎病毒(MN908947) 进行了BLAST对比,现在除了其他武汉病毒的株系(100%),排名靠前的是舟山蝙蝠冠状病毒(MG772933和MG772934, 89%),和各种SARS病毒株系(82%)。

点看全图

进一步将武汉肺炎病毒(MN908947,29903个碱基对)和舟山蝙蝠冠状病毒(MG772933,29802个碱基对)进行比对,二者之间有约1300多个碱基对的差异。这个差异不是武汉病毒比舟山病毒多了一个片段(从两个病毒接近的全基因组长度也能看出不存在直接的大片段插入),而是两个病毒的这1300多个碱基对区域的核酸序列非常的不同,不能像基因组的其他区域那样同源比对在一起。

这1300多个碱基对对应于武汉病毒中是在病毒棘突蛋白(spike)的编码区(58-513位氨基酸),当我们把武汉病毒和舟山病毒的spike蛋白序列进行比对的时候,二者的序列一致性有81%。下图只截取了前560位氨基酸序列的比对结果

点看全图

当我们比较编码二者spike蛋白的核酸序列时,同源比对的匹配区是从约第1540个碱基对开始,也即前面约1540碱基对的核酸序列(对应于前513个氨基酸的蛋白序列)同源性差,但蛋白序列差别相对小。在生物体中,由核酸(DNA和RNA)编码蛋白质序列,每三位连续的核苷酸序列(三联体密码子)编码20种氨基酸中的一种,或终止密码子。所以四种核苷酸组成的三联体密码子共有64种(4x4x4),对应于20种氨基酸和三个终止子,显然会出现多个三联体密码子编码同一个氨基酸的情况,即三联体密码子的简并性。在不同的物种之间,编码同一个氨基酸的各个三联体密码子的频率会有所不同,即三联体密码子的偏好性。在武汉病毒和舟山病毒序列的对比中,差异显著的核酸序列(前1540碱基对)和具有同源性的蛋白序列(前513位氨基酸)很大程度上是密码子偏好性造成的。类似地,你举的两个病毒中E蛋白的例子,二者的蛋白序列完全一致(75/75),而核酸序列略有差异(222/225),也是由于偏好性造成的。

蛋白质作为多数细胞生化过程的执行者,其结构和功能由氨基酸序列决定,具有相似序列的蛋白质往往具有类似的结构和功能。

2) “插入片段”与匹配对象AY862402

对“插入片段”与AY862402进行蛋白序列,二者序列一致性为61%(如下图),低于舟山病毒(对比1)中所示的舟山spike蛋白)。这个AY862402序列是2004年12月21日提交,文章发表于Virus Res. 112 (1-2), 24-31 (2005),其中提及了载体的内容和构建目的:

We constructed a recombinant adenovirus containing a truncated N-terminal fragment of the SARS-CoV Spike (S) gene (from--45 to 1469, designated Ad-S(N)), which encoded a truncated S protein (490 amino-acid residues, a part of 672 amino-acid S1 subunit)

“我们构建了包含N端截短的SARS-CoV Spike(萨斯病毒棘突蛋白S)基因(45-1469碱基对,命名为Ad-S(N))的 重组腺病毒,它编码了截短的棘突蛋白S(490个氨基酸残基,是672个氨基酸的S1亚基的一部分)。”

所以这个片段的来源是SARS病毒,不是人工合成的。

3) S蛋白的插入片段

印度文章的主要观点是武汉病毒的棘突蛋白S具有4个SARS没有的片段,位于约80、150、260和685位,如下图

点看全图

而当我们把源自武汉病毒和舟山病毒(MG772933)的S蛋白比较时,发现插入片段存在于约265、450、480、495和690位。这表明印度组所做的比对太过简略,选取的序列数量不足,放大了序列间的差异性。

点看全图

另一方面,他们选取的“插入片段”太短,与HIV同源性较好的片段1和2只有6个氨基酸,片段3和4长一些(8-12个氨基酸),但HIV对应片段中又出现了进一步的插入片段,而且没有全序列的比对做背景。 他们对于这些片段功能的确认方式只是基于同源建模的模拟,而缺少结构、生化和细胞水平的证据。这种同源性分析只能说聊胜于无。

4) 云南蝙蝠病毒

MN996532 RaTG13于2020年1月27日提交,印度研究组的预印文本是在1月31日bioRxiv上线,几天后撤稿。明显印度方面的撤稿不是由于RaTG13这个事先已经的序列,作为严谨的科研工作者,在文章上线的最后一刻应该对相关的科研进展进行复核,况且是这种实效性很强的研究,而至少3天的时间印度人都没有发现和讨论RaTG13的问题。他们的撤稿也是分析方法和结论出现了多处问题,不仅仅限于RaTG13(如 3)中的一些讨论)。所以强调RaTG13的”火速”提交与印度撤稿的关系我觉得并不能让人信服。

5) 演化树分析

下面Tang兄提及了溯源的问题,我就不多说了

6) 本兄所说的

第一个,哈佛等学校的学者已经指出了:多出1378对非天然的碱基对。

非天然碱基对这个表述的指向性是非常强的,这个消息是否有具体的出处

P.S.: NCBI和BLAST国内都是可以用的

通宝推:青颍路,陈王奋起,桥上,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河