西西河

主题:【信息流行病】新冠超额死亡数据的悖论 -- 夕曦

共:💬34 🌺161 🌵1
分页树展主题 · 全看首页 上页
/ 3
下页 末页
  • 家园 【信息流行病】新冠超额死亡数据的悖论 -- 有补充

    首先声明:

    1, 在我从事的专业领域的一个常识是:没有一个研究可以完美地全面解决研究的目标问题。同样,一个帖子也不可能把与主题相关的所有方方面面解释清楚。没有说清楚的地方,欢迎提问或者补充。虽然比大家多了解一些专业知识,也只是个人很肤浅的认识、个人看法而已,有错误也是必然的。

    2, 这里是用不同的视角看待热点事件:“新冠超额死亡数据的研究“。同时也是将我了解的专业知识介绍给大家,由于知识积累的基线不同,肯定会有与大家不一样的观点。可以探讨,但不希望简单粗暴地贴政治性标签,扣帽子、批判、骂人。

    3, 与数据分析相关领域非常有意思的现象是:表面很明显的眼见为实的东西,统计分析后有可能证明“眼见为实”的观点是错误的;更进一步从不同角度用不同方法分析,还可以发现统计分析对“错误”的认知还可能是错误的,但又不支持原先“眼见为实”的观点。也就是说对同一个事实,在不同层次的认知可以产生截然相反的结论和观点。不同层次的观点,争论谁对谁错是没有意义的,更现实的作用是拓展自己的眼界。

    2020年初爆发新冠世界大流行,当年6月底世卫组织就首次召开非公开的信息流行病学会议,目的是“在COVID-19大流行背景下(世卫组织首次信息流行病学会议

    “信息疫情”现象已经上升到需要进行协调应对的程度。信息疫情是指在疾病流行期间产生的大量信息,有些准确,有些不准确。这使人们很难确定哪个信息源是可信的,在需要的时候也很难找到可靠的指导。即使人们能够获得高质量的信息,他们也必须逾越障碍,才能采取所建议的行动。就像出现流行病时的病原体一样,错误信息的传播又远又快,为卫生应急反应加大了难度。

    这个帖子主要讨论的原始信息产生于一个不完美的专业研究,由哈佛、耶鲁、Baylor医学院等著名大学的学者开展,在顶级国际权威医学期刊《美国医学会杂志》(JAMA)上发表,题目是:新冠病毒Delta和 Omicron 流行期间马萨诸塞州的超额死亡研究,给大众介绍了“新冠超额死亡数据和超额死亡率”的新概念。(超额死亡研究

    该研究观察到的结果是:

    对于所有成人年龄组,与 Delta流行 时期相比,Omicron流行 时期观察到的超额死亡数与预期超额死亡数的比率(所谓超额死亡率)都有所增加”。推导出的结论是:“研究结果表明,即使在高度接种疫苗和免疫能力不断增强的人群中,一种高传染性相对较温和的病毒变异株也可以迅速导致高超额死亡率。

    这个研究的论文发表后,在社交媒体上产生了一些传播又远又快的、与之相关的错误信息,主要的信息流行病有两个,一是奥密克戎有更高的致死率,二是更高的致死率说明奥密克戎比德尔塔的毒性更强。

    首先,我们需要看看超额死亡的研究到底可以提供什么信息。

    超额死亡研究是公共卫生领域的一种不太可靠的间接研究方法,目的是研究疫情爆发对现有医疗资源冲击的程度,据此数据用来辅助评估并选择不同的疫情防控政策和措施。

    我是在非典爆发后期的一次关于非典流行学术活动中最早接触超额死亡概念的。由一个当时兼任世卫组织顾问的教授提出讨论的。因为第一次接触超额死亡概念,特意着重问了几个相关问题,综合讨论的结果,对超额死亡有了以下大致了解。

    对一个国家和地区,医疗资源和水平都是有限的,并且分布不平衡的;由多种因素决定,其中包括经济发展水平、生活卫生习惯、医疗体系和水平等等。由于医疗资源与水平的限制,不是所有的病人都能够得到针对具体病情的理想治疗,必然会出现死亡。有些是在医院治疗过程中出现的死亡,这部分属于医院死亡的统计数据;也有在医院以外的因病死亡,不会记录在医院死亡数据中,而是会统计在社会总和死亡数据中。

    在正常社会生活状态下,会形成两个死亡动态平衡。一是医疗资源供给量决定的死亡平衡,医疗资源不能满足收治所有社会上新出现病例,病人在医院以外因病死亡;另一是医疗水平决定的死亡平衡,就是医院内死亡。从长期看这两个死亡动态平衡中的死亡数据是相对稳定、变化区间不大的,可以用来做为超额死亡研究的对照数据:就是预期死亡数。

    在特殊情况下,比如重大自然灾害、战争、疫情或严重污染事件等,可以导致短期内出现大量新病例或者政府政策措施干预医疗资源被占用,都会导致医疗资源和水平显著下降,正常情况下新出现的病人得不到医疗救治或只能得到低质量的医疗服务,结果是两个死亡平衡都被打破,在预期死亡数之上增加了死亡。虽然医院内和医院外死亡增加的程度可能不同,与预期死亡数相比,都属于超额死亡。

    需要特别强调的是:超额死亡都是特殊事件的附带死亡(collateral death),不是直接死亡。超额死亡研究既可以评估特殊事件连带的间接损失,也可以用来判定采取的对应政策与措施的效果,因此说是间接研究方法,并且使用的死亡数据相对其它公共卫生研究方法来说都是笼统不准确的。

    当时对非典疫情的防控的讨论,有一派的观点是由于中国严格的隔离政策,在医疗资源和水平都相对西方不足情况下,会产生更多的超额死亡。虽然非典病毒的死亡率很高,但全球累积总死亡人数只有800左右,中国医疗资源因隔离被挤占导致的超额死亡很可能大于非典病死亡人数。

    我当时听了很是气结。疫情初期这些专家同事批评中国不承认存在非典疫情导致疫情蔓延,对此问题我无话可说;但中国发现错误后迅速采取断然隔离措施控制了疫情,他们又用超额死亡来批评,虽然是学术讨论,还是让人感到很过分。不过当年中国疫情防控确实问题很多,很难有底气反击这些批评。

    另一个让我气结的地方是,超额死亡研究需要长期的死亡统计数据,中国当时都没有或者是不公开的。在谁都没有中国死亡数据情况下,西方专家用超额死亡估计来批评中国,是无法用数据客观反击的,让人非常郁闷。在这之后我对相关的数据非常留心,发现中国的确有死亡数据,甚至比西方统计的还完整准确,令人遗憾的是一直都不公开。同时行业壁垒和本位主义严重,很难出现跨领域合作将数据的潜能发挥出来。几年之后,我得到一些其它数据,可以间接评估超额死亡,但已经完全没有兴趣做非典的超额死亡分析了,当时粗略估计超额死亡应该远远大于非典直接死亡数。在这个帖子的下半部分,我会用这些数据对上海疫情封控的超额死亡,做模拟分析。

    非典疫情的经历,使我对超额死亡研究的认知一直局限在因隔离防控措施挤占医疗资源导致的超额死亡。这次新冠疫情,才发现另一个极端疫情对应措施:躺平,也可以引起超额死亡。新冠病毒全球大爆发是“百年未有之大变局”的一部分,规模之大远远超出西方发达国家政府的执政能力,居然有公共卫生专家提出群体免疫的“躺平”对应策略。结果每一波新冠疫情,西方国家都会在短期内出现大量新感染病人,极大占用了医疗资源,导致了超额死亡。

    《美国医学会杂志》(JAMA)发表的美国马萨诸塞州新冠超额死亡研究虽然没有在文章中讨论(这是该研究不完美的地方),其中的哈佛作者还是在新闻采访中承认(“较温和”的奥密克戎):

    较温和的奥密克戎个别病例死亡率可能较低,但总病例数太多了,因此总死亡人数上升了。

    我们关心这个的原因是,如果一切都在很短的时间内发生,就像是奥密克戎爆发时的情况,那么医疗保健系统的压力就更难以弥补和适应。我们在全国(美国)范围内看到了这种情况;医疗系统超出了他们的极限。这对每个人来说都很可怕。

    西方国家超额死亡研究的结果,反应出来的是“躺平”策略附带的新冠疫情超额死亡。中国坚持的动态清零政策是严格的隔离防控,与“躺平”策略是截然相对的。新冠超额死亡数据的悖论,在于“躺平”策略和动态清零都可以产生超额死亡,但引起的原因是不同的,从不同的平衡端打破了死亡动态平衡。“躺平”策略极大增加了需要医疗资源救治的新病人,而严格的隔离防控却限制新冠以外其他病人对医疗资源的需求。所以西方超额死亡研究的数据有用但是是不能用来直接使用的。只能使用中国自己的统计数据,确定隔离防控的超额死亡,再来从死亡动态平衡两端与西方超额死亡数据参照,在隔离与开放之间选择最佳的防控措施。

    ---------------

    待续

    通宝推:陈王奋起,happyyuppie,戒定慧,普鲁托,桥上,不远攸高,
    作者 对本帖的 补充(1)
    家园 【信息流行病】对新冠超额死亡不同层次认知的悖论 -- 补充帖

    我在原帖的声明中,提出:“同一个事实,在不同层次的认知可以产生截然相反的结论和观点。”

    借河友283号出口的回贴(不太相信“超额死亡应该远远大于非典直接死亡数”),正好进一步讨论一下。

    这个回贴的观点是:

    我和我家族认识大量人,定居在中国非典/新冠爆发得最厉害的若干地区。我们确证至少4人直接死于新冠,但没有人间接死于新冠。

    这是明显的“眼见为实”层次的认知,在自己和可信赖的人眼见的范围内得到认知,才是确定的。

    JAMA上发表的新冠病毒超额死亡研究,使用的是一般人接触不到或者是处理不了的死亡统计数据,是“眼见为实”之上一个层次的认知。大部分死亡不是一个人能够“眼见”的,但又是真实存在的。作者分析数据后得出的结论是“高传染性相对较温和的病毒变异株也可以迅速导致高超额死亡率”,显然这与“眼见为实”的结论是不同的。

    那么在JAMA之上,是否还有对新冠病毒超额死亡的认知?

    我能够想到的方法,是把JAMA研究发现的超额死亡数据进一步和同期新冠死亡数据进行比较。

    JAMA研究确定两个关键数据:在23周的德尔塔疫情期间,马萨诸塞州超额死亡人数为1975人;在8周的奥密克戎疫情期间,发生了2294例超额死亡。

    对比同期的新冠死亡数据(这个研究结果非常唬人,尤其是由哈佛、耶鲁、Baylor),德尔塔23周内,新冠感染人数23.8万人,死亡1292人;奥密克戎8周,新冠感染人数59.4万人,死亡2494人。

    可以看出奥密克戎疫情期间新冠死亡人数比超额死亡数还多出了200人,那么是否可以认为这期间超额死亡都是由新冠疫情直接引起的(与正常死亡有部分重叠,或者是统计误差),并没有间接对医疗资源冲击导致的额外死亡?

    再比较看德尔塔疫情期间新冠死亡人数只占超额死亡数的65%,剩余的35%是否才应该算做真实的超额死亡数?

    如果对以上两个问题的回答是肯定的,是否可以认为德尔塔可以产生比奥密克戎更多的超额死亡,所以毒性更强?是否可以否定信息流行病的错误认知:“奥密克戎有更高的致死率,更高的致死率说明奥密克戎比德尔塔的毒性更强”?

    在这个层次(结合其它公开数据比较分析)的认知,是我部分否定JAMA新冠病毒超额死亡研究结论的依据,认为这个研究有缺陷。

    再进一步分析,该研究确定的德尔塔疫情流行周数接近奥密克戎疫情周数的3倍,那么把统计的总超额死亡数按照每周平均进行计算超额死亡率,很自然会得出奥密克戎疫情的超额死亡率是德尔塔的3倍以上。这是另一个信息流行病的错误认知。

    回顾一下从“眼见为实”到JAMA研究,再到结合新冠死亡数据对超额死亡的认知过程,可以看出这是一个逐步上升经过两次否定的过程。很容易让我们联想起中学政治经济学中学习过的东西,伟人教员早在80多年前就已经深刻、系统、全面地说明过人类的认知过程了(《实践论》)。

    重复地说,论理的认识所以和感性的认识不同,是因为感性的认识是属于事物之片面的、现象的、外部联系的东西,论理的认识则推进了一大步,到达了事物的全体的、本质的、内部联系的东西,到达了暴露周围世界的内在的矛盾,因而能在周围世界的总体上,在周围世界一切方面的内部联系上去把握周围世界的发展。

    从认知的不同层次看待争论,对我来说会更加关注能够学到什么,不会太在意与争论本身的对错。

    --------------

    待续

    • 家园 不搞复杂的准确,来个最简单直观的对比

      数据来源:美国CDC每周死亡人数统计

      该数据每周公布,但会对以前公布的数据做修正,多数情况是增加,估计是数据报送时滞造成的,经验上20周之后就比较稳定,每次修正增加量在三位数。

      跨年的周以周四所属年份确定该周所属年份。

      以2014-2019年各周总死亡人数均值为基础(“正常值”),高于此数值即为“多死人数”,低于即为“少死人数”。

      结果如下图所示。请注意2022年各周死亡人数最后几周大幅下降,估计是因为前述数据报送时滞,是否表明实际死亡人数下降,尚需继续观察。

      点看全图

      通宝推:桥上,
    • 家园 超额死亡的定义

      需要特别强调的是:超额死亡都是特殊事件的附带死亡(collateral death),不是直接死亡。

      按我的理解,超额死亡是特殊事件的直接死亡与附带死亡之和。或者说,超额死亡是实际死亡与预期死亡之差。这个预期死亡是正常情况下(即没有特殊事件发生)的死亡数。

      • 家园 没想到定义还有分歧,说说俺的理解

        一个疾病,对社会造成的影响如何:

        一般是看“病死率”,就是说,得了这病,多少人得死。

        还有就是看“死亡率”,就是说,这社会上有多少人得这病死了。

        这两个概念,有的人容易搞混。这么说,就很容易区分:

        狂犬病的病死率是100%,狂犬病死亡率却只有0.0001%(举例,具体多少,没查)。

        说得再明白一点,得了狂犬病必死,但这个社会上每年因得狂犬病而死的却只有百万分之一。

        ========

        现在,无论阿尔法、德尔塔、奥密克戎,新冠的病死率是多少?世卫组织,包括每个国家,都是一笔烂账,没法精确。为什么?

        因为感染人数是多少根本就搞不清。

        有的人得上了,也不去测核酸;

        仅测了一次核酸,根本就不准,漏诊率太高。……这些逃脱、最终又不发病的人,严重干扰了病死率的计算。

        不过,死亡率,相对好计算一些。毕竟,死个人,是大事。医院、殡仪馆、派出所、社保……都会有记录,一般不容易漏。

        会遗漏的地方是,没死在医院,搞不清咋死的;

        还有就是,死在医院,死亡通知书上填写标准不一致。到底是新冠-肺衰竭死亡,还是心脏、脑肝肾器官并发症死亡?各家医院的医生都不一定能搞清楚……反正人死了,核酸阳性,填个新冠死亡,走人——美国就是这么干的(?),河里有美国医生吗,来具体说两句😄😄

        =====

        新冠病死率、死亡率如此粗糙,又该如何更准确地去评价新冠及其防疫对社会的影响呢?

        有人想出了“超额死亡率”——不要管它如何死的,我们只算死亡人数好了!

        2010年——2020年,把死亡曲线搞出来,要么有个稳定的斜率,要么有个稳定的曲率(当然,画曲线既可以按年算,也可以按月算,无所谓)。根据稳定的曲率/斜率,把这个曲线延画下去……就是虚拟的2020、2021、2022的预期死亡。

        然后把2020年新冠来了的真正死亡数据画上去,两条线一对比,就是超额死亡(可正,也可负)。

        当然,有人会说,新冠只是超额死亡的原因之一。对!这是用超额死亡来评估新冠的缺陷之一。

        因为这个超额死亡有可能是同一时期别的因素造成的,比如战争,像乌克兰今年的超额死亡就没法全赖给新冠,这大概得赖给普京和泽连斯基、拜登😄😄

        但,像美国、中国、欧洲的其他国家,没有战争、没有经济危机、没有自然灾害……,只有新冠这个传染病。无论清零、还是躺平,超额死亡都可以归于新冠这个社会最大变量。

        那么,超额死亡的正负结果,可以作为较好地评价新冠及其防疫措施的指标。

        除非,除非有人非要抬杠——特朗普大概会认为,2021发生了特朗普/拜登的总统轮换,所以,美国的2021以后的超额死亡可以叫“拜登死亡”😂😂😂

      • 家园 我的理解是:与正常年份预期死亡数比较后的增加数

        正常年份总死亡数在统计学上会有个曲线(预期数),疫情三年这个正常年份可能要推算2018-2019前的情况。

        但总的来说超额死亡数是个粗糙的概念,用来分析单个因素并不十分科学,他可能是多重因素重合在一起的作用,单独拎出来说是某个原因缺少说服力,比如经济周期原因、就业竞争原因、房地产原因、社会治安等或它们的总波动等,

        .....好吧,我说的是美国:》

      • 家园 疫情中新冠直接相关死亡各国都有统计

        如果计算疫情的超额死亡,应该减除疫情直接死亡后,剩余的才是超额死亡。

        • 家园 JAMA论文中的超额死亡

          即excess deaths/mortality,跟你的定义不一样:

          The COVID-19 pandemic has produced excess deaths, the number of all-cause fatalities exceeding the expected number in any period.

          We applied autoregressive integrated moving average (ARIMA) models to US Census populations (2014-2019) and seasonal ARIMA (sARIMA) models to Massachusetts

          Department of Health all-cause mortality statistics (from January 5, 2015, through February 8, 2020) to account for prepandemic age and mortality trends and to project the age stratified (0-17, 18-49, 50-64,and≥65 years) weekly population and the weekly number of expected deaths in Massachusetts during the pandemic period

          Excess mortality for each period was defined as the difference between the observed deaths and point estimate for sARIMA-determined expected deaths.

          超额死亡是实际死亡与预期死亡之差。这里的预期死亡(expected deaths)是基于疫情前的数字,应该不包括疫情直接死亡, 不然就得不出论文的结论:

          Others have reported that the Omicron variant may cause milder COVID-19. If true, increased all-cause excess mortality observed during the Omicron wave in Massachusetts may reflect a higher mortality product (ie, a moderately lower infection fatality rate multiplied by far higher infection rate).

          the present findings indicate that a highly contagious (although relatively milder) SARS-CoV-2 variant can quickly confer substantial excess mortality, even in a highly vaccinated and increasingly immune population.

          • 家园 感谢你的认真,之前回复时我已经考虑这个问题。

            因为疫情直接死亡数据都已经统计过了。超额死亡本身就不是个准确的统计数据,在统计疫情超额死亡数时不减去疫情直接死亡数据,不仅是没有必要的重复统计,而且研究的方法就更有问题了。

  • 见前补充 4755692
      • 家园 再说一个“眼见为实”层次的认知吧

        我们确证至少4人直接死于新冠,这4人都是在2020年1月25日到2020年2月15日这3周的时间内去世的。之前之后3个月时间段内我们再也没有确证任何人去世,包括与新冠有关联或无关联。之前3个月的数据可能有误差,因为太平年月噩耗传得不远;但是之后3个月的数据是比较可信的,因为大家注意力全在这个上面了。

        所以,我个人的认知是:新冠在武汉其实只肆虐了一个多月(1月初到2月中),即使有“超额”死亡,多半也发生在这4-5周内。其实新冠这种烈性传染病,或者几周内控制住,或者溃烂不可收拾。

        回到你建模用的统计数据,“德尔塔23周内...奥密克戎8周...“,拜托,你这是”躺平“用模型!新冠,武汉没躺平,上海后来也没躺平;非典,北京没躺平,广东也没躺平。你这个模型,根本就不适用。

        最后我想说:武汉是英雄的城市,为抗击新冠付出了巨大的牺牲;有些事情,因为担心被人曲解利用做文章,不方便公开说;但我认为这不表示中央地方政府想隐瞒什么。作为对比,某城为了一己私利,险些葬送全国抗疫成果,我发自内心地送那帮王八蛋一句“xxx”!

        通宝推:愣头兔,MaverickZ,脊梁硬,
        • 家园 你说的观点我可以理解。原帖是讨论热点话题

          涉及专业知识比较多,我声明中说过:由于知识积累的基线不同,肯定会有与大家不一样的观点。可以探讨,但不希望简单粗暴地贴政治性标签,扣帽子、批判、骂人。

    • 家园 还是先拿数据,再说结论比较好

      否则影响你的个人信誉。

      • 家园 哈哈!我的个人信誉在河里早就很差了。

        写作发帖对我来说都是自我学习的过程,没有考虑太多其它的东西。所以我只会适度争论,不会强求谁对谁错;也只是在河里发帖,不在其他地方发。

    • 家园 楼主还有非典时期的数据?

      从大数据上说,中国防控两年半,似乎没有超额死亡(?)

      很幸运,我们2020年刚好做了人口普查:

      点看全图

      补一个,2020年的是1000万。

      从2011到现在,画根线,很平缓的上升,看不出有超额死亡。这是中国的整体情况。

      但是,上海的防控与众不同,单独拿出来研究,很有试验意义和将来的指导意义。

      通宝推:审度,
      • 家园 人口普查是每10年进行一次

        普查之间年份的数据包括出生、死亡等,是统计抽样数据后的估计,非常不准确。

        中国肯定有像美国著名的死亡指数(death index)类似的死亡统计,经过逐级上报汇总,而且应该比美国的更详尽准确。

分页树展主题 · 全看首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河