西西河

主题:1月5日上海公共卫生临床中心谣言反转再反转 -- 海峰1

共:💬38 🌺158 🌵9
全看分页树展 · 主题 跟帖
家园 记录一下首次发现新型冠状病毒的经历

新型冠状病毒是怎么被发现的?首次发现者当时惊呼

记录一下首次发现新型冠状病毒的经历~

2019年12月26日刚上班,还是如往常一样先大概浏览一下这一天的mNGS病原微生物自动解读结果,没问题的话就开始一天的研发工作了。

意外的是,发现有一个样本报出了敏感病原体——SARS冠状病毒,有几十条的序列,且这个样本只有这么一个有意义的病原体,如果是普通病毒,这已经是一个相当可靠的结果了。心头一紧,赶紧后台查看详细的分析数据,发现相似度并不算很高,只有大约94.5%(这跟卡相似度的阈值有关,相当于只筛选下了相似度比较高的序列)。

想到有几种可能:1、SARS不同毒株基因组有一定差异;2、RNA病毒容易突变,距离SRAS事件17年了,变异比较大;3、近缘物种的错误比对等等。为了确认结果的可靠性,开始了详细分析。

好在之前已经遇到过几次这种类似的敏感的病原体确认分析工作,而且领导也曾跟我讨论过几次能不能做一个新发病原自动挖掘的分析流程,心里一直记着这个事情,在做其他权重更高优先级更高的项目时也随手做了一个初步的版本出来,这个样本刚好可以派上用场。我给它起了个名字,相比于日常生产用的分析流程,它多了个后缀:“探索版”,包含了几乎所有已测序的病毒基因组。

探索版的分析结果提示这个病原体跟Bat SARS like coronavirus最相似,整体相似度在87%左右,而跟SARS的相似度是约81%。比对上的序列数由几十条上升到了500多条,此外也组装出了5条contig,加起来有1200多bp,此时基本上可以确认是一种冠状病毒,可以针对冠状病毒进行详细分析。分析期间也开始跟解读负责人和领导小范围内部保密讨论。

进一步分析,无论是拿原始序列去NCBI nt库blastn,还是拿组装后的序列去blastn,结果都是跟Bat SARS like coronavirus最相似,但整体的相似度也是只有87%左右,进行nr库蛋白blastx对比的相似度也差不多,因此对结果保留怀疑。

病毒的分类信息一直都很混乱,分类规则不统一,有些基于分型基因(比如甲流)、有些则没有明确的分型基因,通过其他方法去分类。此前并没有去调研过Bat SARS like 跟SARS的分类方法,在NCBI Taxonomy上,Bat SARS like 是划分到SARS下面的。

如此紧急的情况下,没有时间去调研文献,手上的数据也不多,基于基因组的相似度,潜意识里认为既然Bat SARS like是SARS的下属分类,那么这个检测到的未知病毒至少也是一个跟Bat SARS like平行的物种,即一个新型的Bat SARS like(后来看文献SARS和Bat SARS like是通过几个非结构蛋白进行分类)。

下载了所有冠状病毒的基因组,最后经过质量过滤、聚类等分析,筛选出了160株的冠状病毒基因(基本包含了所有已知的各种动物的冠状病毒)。将组装的序列与160株冠状病毒基因组基于全基因组平均相似度做了进化分析(题外话,个人认为在物种进化分析上,基于全基因平均相似度构建进化树,比基于某个基因构建的进化树要更准确、合理一些,毕竟是从全局来考量,当然,研究结构、功能等另说,此时组装的序列也很短,没有完整的基因序列),结果不出意外,还是跟Bat SARS like coronavirus聚得最近,而且也是在SARS的大支上。

图注:左上角一大块红色是SARS,边缘颜色没那么红的是BatSARSlike,再往外的大蓝边是另一群Bat SARS like,未知的病毒跟45、21聚在比较独立的一支上了,红框圈起来的。

比较奇怪的是,这个未知的病毒跟bat-SL-CoVZC45和bat-SL-CoVZXC21聚到了一个相对独立的分枝上,而其它Bat SARS like则很集中地聚在SRAS那一群里面,想着也许是这两个的分类有点问题,但去看了出处的文献,方法上跟其它的也没啥区别,尊重文献的分类吧,暂且认为是对的。(这也是后面某些专家们把这个未知病毒判定为新型冠状病毒的依据之一)前端反馈这个患者病重,着急要检测结果,但是这么一个重大的病原体确实不可轻易报出,中午跟几个领导紧急开了个会,决定继续深入分析,延迟发放报告,同时分享数据给中国医学科院病原所一块分析。

后面从基因层面(orf1ab、S、N等基因)进行了深入分析,并没有什么意义比较大的发现了,主要还是检测到的序列数少,覆盖率太低,都是不完整的基因,做不了什么。中午时已经提出了重测补数据进行分析。重测可以进行技术重复性验证,避免一些未知因素的污染导致的假阳,确保样本确实有该病原体,另外可以有更多的数据进行分析,如能组装出完整的基因组,分析结果更可靠,能做的深入分析也更多。第二天(2019.12.27)一早数据出来后,赶紧进行了组装分析,终于组装出了接近完整的基因组序列。数据同时也共享给了中国医学科学院病原所做其他深入分析。这次的序列数由之前的500多条升到了47万多条!因为时间有限,还有其他研发项目需要做,就没有详细去对组装结果进行补gap获取完整基因组了。另外也已经分享数据给病原所了,他们也会做这个,所以就没有去组装出一条完整的基因组序了,已有的组装结果能满足大部分分析需求了。

后面也继续做了一些深入的分析。

回帖序列分布均匀,没有明显的偏好,平均深度和中位深度基本一致,深度达到了1000x,说明组装没啥问题,测序也挺好,未知病原体也是完整的基因组存在。

新型冠状病毒和SARS不同的基因的相似度不同,从75%到94%不等,特别是S基因,与人细胞受体(ACE2)相关,相似度才75%。所以说不是SARS,那也算是有依据吧。不过后来石正丽的文章中,通过他们的方法分析,新型冠状病毒也是属于SARSr-CoV(SARS相关冠状病毒)。

事件后续的发展大家都知道了。这里再说说几个问题。

为什么我们两天就已经分析出了这个未知的病毒是一个跟SARS很像的冠状病毒,并且上报了所有分析结果,官方要到1月7号才发布消息明确肺炎是由新型冠状病毒引起的?

其实我们做的工作只是分析鉴定了送检样本里面有这么个病毒,但肺炎是否是这个病毒导致的,我们并没有去分析,也无法去分析,检测到病毒不等于肺炎由该病毒引起。如此重大的卫生事件,官方自然要严谨论证,而且也有一套国际参考验证流程(科赫法则)。官方要做的不仅是检测到多个样本都有这么个病毒,还要验证肺炎是因为这个病毒导致的等等。

这个事情还有一个很感概的事情就是,知道真相的人噤如寒蝉,不知道真相的人各种“大力科普”、“深度分析”;亲身经历的公司只字不敢言,其他公司各种借势营销。从鼠疫到新型冠状病毒皆是如此,呵呵,好有意思。

要谈对整个事件的看法,最大的感觉就是失望,痛心,还有愤怒。我们都已经发现那么及时了,为啥现在还是没能控制住?让全国进入的疫情大战?更多的不是科学因素,也不是技术因素,而是决策和媒体。我曾经是个很愤青的人,事已至此,无力回天,传递信心才是最重要的吧。马后炮,人人都是精英,谁都不曾想到事情发展成这个样子,所以也懒得去批判很多事情了。但有些话还是想说几句。

辟谣SARS、媒体宣扬的乐观情绪,这些在最早期的时候都没有太大问题,毕竟对这个病毒的认知非常有限。在应对这些重大公共卫生事件时,疾控系统可能采用“内严外松”的规则,内部谨慎小心、严格验证、仔细评估,对外通告却可能偏向乐观,避免引起过度恐慌。何况在这次事件上,怎么去给公众交代,显然已经不是疾控系统能单独决策的事了。武汉交通枢纽的地位不必多言,当时也临近春节,正是餐饮、旅游、电影等服务业的旺季。悲观的宣传无疑会重创这些服务业,还会引起大众过度恐慌,导致物资哄抢,社会混乱等严重后果。若这病毒真无什么传播能力,或者因为采取了这些措施扼杀了病毒的传播,社会没看到这个病毒能带来什么危害,决策者必然会被骂反应过度、小题大做,到时自然要背锅。相反,过于乐观的宣传,病毒不强则皆大欢喜,开心过大年,病毒强则会导致大众缺乏防范意识,防控工作难以展开,最终导致病毒的快速传播,产生更加严重的后果。所以,当你作为一个决策者的时候,你不得不综合考虑方方面面的因素,社会、经济乃及政治各方面都需要做一个平衡,非常考验决策者和专家们的能力和远见。走对了,平淡无奇,走错了,千古罪人。

这个世界没有平行宇宙,我们无法知道哪种决策才是更正确的,或更错误的。在国内这种什么事情都喜欢往乐观上面宣传的大氛围下,以及侥幸心理的存在,决策者做什么决策,可想而知。

在事件的后期发展中,特别是1月12号左右开始,我相信专家们已经看到事情正在往不好的方向发展了(首批确诊的41例患者,约30%并无海鲜市场接触史,此时多地开始出现疑似病例了,有些已经初步核酸阳性)。但是在后续的宣传上还是太过于乐观和艺术化了,同时还在不断辟谣,还没任何发布预警的迹象。“不排除有限人传人,持续人传人风险低,可防可控”,用词颇为谨慎讲究,且不说是否过于乐观,就问有多少普通民众知道什么是“有限人传人”?什么是“持续人传人”?他们的理解可能就是基本不会人传人,自然毫无戒备之心。我还在朋友圈科普了一下。从现在发表的很多论文上也可以看出,很多专家很早就对这个病毒的传播能力有较深的认识了,越往后,掌握的数据越多,对局势的预判越清晰。我相信专家们早已给出不怎么乐观的预判,但如果某些人,为了顾及某些人或某些媒体的面子(毕竟之前宣传得太乐观,现在打脸太疼),罔顾专家意见,不顾民众健康,不得不往乐观上面去通告,坚持不发布预警,这就不可原谅了。无论是谁,该罚的罚,该撤职的撤职。

别的不多说了,谈点希望吧。mNGS确实是一个好技术,在疑难、危重病例诊断以及这种突发的重大公共卫生事件的早期监测和爆发监测中起到很大的作用。现在提供mNGS病原体检测服务厂商有很多,建议疾控系统可以跟一些技术好的企业建立直接沟通的渠道,能够更快速地应对像这样的突发事件。另外,mNGS企业们也可以建立一个信息共享平台,在遇到这些事件时及时共享信息,看看是否有爆发(我知道这个很难,一方面本来就是商业机密,另一方面敏感病原体谁都不敢轻易报吧,但我还是觉得这个事情很有意义,希望有朝一日可以成为现实吧)。也希望我们经历了这次新型冠状病毒事件后,国家的重大公共卫生事件的处理能力有长足进步吧。个人认为,在通告宣传上可以借鉴天气预报的规则——“总是会往危害大些方面去预报”,以提醒民众做更多预防,降低心理预期。俗话说:没有期望就不会失望。

这件事情对我而言,仿佛就是一场年终大考,用尽所学,交了一份还算合格的答卷吧,只是这份答卷是否发挥出最大的作用了呢?第一次亲身参与到了一次如此重大的公共卫生事件,做出了一点贡献,也锻炼成长了许多。

据我目前所知,最早发现这个病毒的应该就是我们了,因为也是我们上报结果以后,疾控系统开始介入。从GISAID数据库网站上提交的数据看,样本收集的时间也是我们最早的。也许其他机构也测到了这个病毒,但这是未知的病毒,核酸数据库中没有参考基因组,他们不一定有这个生信能力去分析鉴定。所以,应该就是我们首次发现了这个新型冠状病毒吧,记录一下。

希望早点战胜疫情吧。

中国加油!武汉加油!

2020.01.28

通宝推:桥上,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河