近期网站停站换新具体说明
按以上说明时间，延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间

主题：【原创】关于RCT与RWS -- 懒厨

共:💬132 🌺434 🌵16

老大河待整

分页树展主题 · 全看首页上页下页末页

家园

【原创】关于RCT与RWS -- 有补充

我已经很久没有正经写点东西了，国庆几天吃吃喝喝，现在终于有点闲暇，静下心来，网上看了一些资料，是之前最近我和中医粉争论的一个验药的方法问题。

先把关键词解释一下：

RCT （Randomised Controlled Trial）- 随机对照试验。

RWS/RWD/RWE/RWR (Real World Study/Data/Evidence/Research)真实世界研究（数据/证据），四个简写说的是同一回事，以下使用RWS这个缩写。

这两种都是方法而已，除了验药，我还见过社会问题的研究，也可以用这两种方法进行研究。而这里说的，涉及中西医之争，讨论限于验药的方法。通过一个例子来解释，应该是最容易理解的了，解释有误之处，恳请行家指点。

假如有一个新药上市，声称可以治某个病，我们要如何检验这个药效呢？

传统的做法，是使用RCT来验药，简单来说，做法如下：

1. 招募病人，有鉴定过程，需要保证两组病人的患者特征基本一致；

2. 将病人随机分成两组；

3. 一组吃安慰剂，另一组吃新药；

4. 负责的医生不知道某个病人吃的到底是安慰剂还是新药；

5. 负责发药的人，也不知道新药和安慰剂分别发给了什么人；

6. 疗程结束后，公布哪些病人吃了安慰剂，哪些病人吃了新药，然后对结果进行统计

7. 最后，再根据统计结果，如果比安慰剂的一组高很多，即可视为有效。

需要强调两点：

1. 这个方法的模式基本是固定的，无论什么药，只要遵循这个模式，满足该模式下的各个具体要求，就能获得一个可靠的结果。

2. 这个模式操作起来确实麻烦，之所以这么麻烦也要这么操作，是因为有两个因素必须排除，其一是人体有一定的自愈能力，其二是人体有一个安慰剂效应，假如一个人吃了药好了，其中的因果关系，要如何确认呢？到底是自愈，还是真的有效？ RCT的方法，正是一个有效排除干扰因素的利器。

这些年开始提出RWS的验药方法，主要的区别在于C字，Controlled, 这种验药的方法，就直接用药，也有对照组，以争议起点的清肺排毒汤为例，他们实际上就是安排了一些病人喝这个中药，另一些病人没有喝药，然后对上万个病历进行分析统计，虽然没有严格控制的对照组病人，他们从病历数据下手，尽力排除干扰数据，从而推出相应的结论。

两种方法对比，很明显，无论数据如何挖掘，RWS方法里面，安慰剂效应是无法排除的，毕竟吃了药，听说这药有用，多少会影响病人的心理。这个不是我说的，是中医药抗疫的领军人士张伯礼说的，有截屏为证：

点看全图

于是，我接着上网调查，发现了这里有篇不错的文章， https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6097073/

想省时间的话，可以看两个表，第一个是两种方法的对比，

点看全图

我尝试翻译一下：

对比项	RCT	RWE
目的	Efficacy 验证有效性	Effectiveness 验证效果
设置	按实验设置	按真实世界情形来设置
跟进	按设计进行	按实际情况进行
治疗	固定模式	可变模式
研究对象组别	同质	非同质
参与医生	仅限调查者	多个行医者
对照项	安慰剂或挑选过的其他干预方式	多种干预方式
病人监控	持续，按研究方法进行	可变

这个表里面，最重要的是第一条，两者的目的是不一样的，RCT是用来验证药的有效性（Efficacy），RWS用来验证药的效果（Effectiveness）（注意：英文里面Efficacy与Effectiveness是有微妙的区别的，按照我的理解，Efficacy存在因果关系，Effectiveness仅是用来说明效果，其效果不一定存在因果关系）

关于Efficacy以及Effectiveness的区别，还是以上述的例子，RCT可以用来证明，排除了人体自愈以及安慰剂效应等各种干扰因素，某种药物的有效性，而RWS则不然，这个方法只会告诉大家，吃了这个药，通过一些数据的处理，可以确认有效率达到某个百分比，至于这个是否由安慰剂效应导致的，我们无法排除。

然后我们可以看一下第二个表，这个是对比这两种方法的优劣：

Advantages

Less time and cost consumption compared with RCT

- Possible to shorten the duration of clinical research

- No period needed for patient recruitment/enrollment

Presentation of the directionality for RCT

Research that cannot be done with RCT is possible

- Safe research on high-risk groups

Detection of less frequent side effects

Rapid access/easier information and data retrieval

Prediction model or high-risk group selection

Set a foundation on AI

Limitation

For correct analysis, a massive amount of data should be collected.

Much time needed for DQM

Experienced experts needed for the analysis of the massive amount of data

Lack of privacy/confidentiality/lost data

Standardized research protocol needs to be established before research

- High possibility of bias

- Possible to interpret with bias or incorrectly based on research results

简单翻译如下：

优点：

- 时间与成本较低

----有可能缩短临床研究的时间

----无需耗时招募病人

- 为RCT展示了方向

- 可在RCT不适用的情况下进行研究

----在高风险组别的研究较为安全

- 可检查出较少发生的副作用

- 迅速获取信息与数据

- 可以用于预测模型或者高风险组别的选择

- 为人工智能奠定基础

缺点：

- 如要正确的分析，需要收集数量庞大的数据

- 需要很多时间进行数据质量管理

- 需要有经验的专家对数量庞大的数据进行分析

- 存在缺少隐私，保密，数据丢失的问题

- 在开始研究之前，需要对研究方法（protocol）进行标准化处理

---- 很高的可能性出现偏差

---- 对研究结果可能存在有偏差或者不正确的解读

总结一下：

对比完两者的目的和优劣，结论显而易见，这两个方法是互补的，换言之，在RCT不适用的情况下，可以用RWS顶上，但由于没有一个固定模式，其效果取决于研究者的本领。总而言之，根本就不存在用RWS代替RCT的问题。

当然，我的话中医粉可以不信，但进行清肺排毒汤RWS研究的人的话不能不信吧？请看这里：

qq97:补充，一篇与该论文相关的报道（节选）

“若能针对清肺排毒汤开展随机对照试验，将有望进一步确证其临床疗效，并推动其广泛应用，挽救全球数以万计的新冠肺炎患者的生命。”李静补充道。

如果RWS足够完美，李静不会这么说吧？这不就默认了RWS就是不如RCT那么可靠吗？

中医想翻身，RCT这个坎是一定要过的，不要想着走捷径，用RWS就可以万事大吉了。

通宝推：从来,菜根谭,

作者对本帖的补充(1)

家园

【原创】一个RCT实操例子 -- 补充帖

最近在看一本关于数学在生活中的应用的书，碰巧看到一个例子，关于RCT的，虽然不是真实案例，但很有意思，值得说一下：

有一个治疗高血压芬塔可的新药上市，招了2000人做试验，男女数目一样，分成两组，每组1000人，做RCT的总结如下：

治疗效果	A组: 芬塔可	B组: 安慰剂
有改善	560	350
无改善	440	650
改善率	56%	35%

从结果看，似乎这药还行，但是，由于性别这个因素很重要，我们又对性别做了一下细分，结果发现是这样的：

男性：

治疗效果	A组: 芬塔可	B组: 安慰剂
有改善	40	200
无改善	160	600
总数	200	800
改善率	20%	25%

而女性：

治疗效果	A组: 芬塔可	B组: 安慰剂
有改善	520	150
无改善	280	50
总数	800	200
改善率	65%	75%

太震惊了，只不过细分了一下而已，结论居然相反！一个优于安慰剂，另一个差过安慰剂！

为啥会有这种不同呢？其实就是由于性别这个因素非常重要，而这男女在这两组之中的占比并不一样，导致合并之后得不到一致的统计结果。

既然知道了性别是很重要的因素，我们可以尝试一下同样占比的试验数据：

男性：

治疗效果	A组: 芬塔可	B组: 安慰剂
有改善	100	125
无改善	400	375
总数	500	500
改善率	20%	25%

女性：

治疗效果	A组: 芬塔可	B组: 安慰剂
有改善	325	375
无改善	175	125
总数	500	500
改善率	65%	75%

然后再看看合并的统计数据：

治疗效果	A组: 芬塔可	B组: 安慰剂
有改善	425	500
无改善	575	500
改善率	42.5%	50%

现在看，用于控制了性别这个关键变量，无论是性别分组，还是汇总，我们都能得到一致的结论，这个新药确实不如安慰剂。

这个例子简单吧，只要初中水平的数学能力，应该都能理解吧？RCT的原理就是这么简单，模式固定，自己去找变量，有对照组就是方便。

好了，轮到我来向RWS的粉丝提问了，这个药在没有安慰剂对照组的情况下，要如何操作？

先说说我的理解，RWS是直接上药，进行统计，肯定能够发现男性有20%的改善率，女性有65%的改善率，然后呢？

通宝推：光头佬,从来,

见前补充 4668554
- - 复【原创】一个RCT实操例子
    家园 男女比例如此失衡，这个怕不是RCT吧。
    真正的RCT重在随机分配，两个组在统计上应该是无差异的。在1000名这么大的样本规模，两个组的男女比例竟然是4：1对1：4，说明这个实验的样本分配不是随机的，本身就不是RCT.
    - 复男女比例如此失衡，这个怕不是RCT吧。
      家园 你说的对
      这个不是一个真实的例子，原本是用来示范统计学在医学方面的应用的，前面作者故意给出一个反面的例子，后面再给第二个例子，示范如何把错误纠正过来。
  - 复【原创】一个RCT实操例子
    家园 这个例子充分说明RCT是比垃圾略好的工具
    第一次合并结果，芬塔可对比安慰剂并没有明显的改善；第二次也没有明显改善，说明这个药本身就不行。
    但是缩小了检测范围，出现了数据反常，这正常吗？很正常。因为血压这东西本来就是非常主观的东西，测试的时候兴奋一点，马上就会升高，相反则会降低。明显的证据是女生那一组，安慰剂也明显改善了。
    用和主观意图密切相关的例子来证明RCT，本身说明了RCT仅仅对药效不明显的病来做不靠谱的微弱区分。
    - 复这个例子充分说明RCT是比垃圾略好的工具
      家园 是否垃圾是价值观的判断
      我只想了解RWS会如何操作，是否比RCT更容易操作，在没有安慰剂对照组的情况下，如何判断到底是安慰剂引起的，还是真实的药效。
      另外关于你说的这个：
      第一次合并结果，芬塔可对比安慰剂并没有明显的改善
      我给的例子是56%对35%，应该说是优于安慰剂的。
      但是缩小了检测范围，出现了数据反常，
      不是缩小了检测范围，而是拿着同样的数据，根据性别来分组。
      另外，第一段话已经说了这个不是真实的案例，只是用来做示范的。
      高血压做过太多的研究，安慰剂效应肯定已有不少历史记录做参考的了，但是，假如一种新的疾病，例如新冠，你会没有安慰剂效应的数据，RWS要怎么办？
      通宝推：从来,
      - 复是否垃圾是价值观的判断
        家园 建议看统计会犯错和Regina Nuzzo关于P值的论文。
        复建议看统计会犯错和Regina Nuzzo关于P值的论文。
        家园 理论要经过实践检验
        讲真，这栋楼里，关于RWS的理论都是一套一套的，唯一见到一点操作实践的还是清肺排毒汤那篇文章，虽然没有说明白要如何排除安慰剂效应，好歹还是有实操的。
        你也不用再说什么理论了，实践一下，用这个例子，做个方案出来，看看能不能说明白，你的方案如何排除安慰剂效应？
        我问了陈王了，他似乎也没啥好招，要不你试试？
      - 复是否垃圾是价值观的判断
        家园 RWS的前提是已知这个药由降血压的生理机制
        且已经证明五毒，在动物试验证明疗效，在小组人群中证明有效。接下来可以征求志愿者，在住院病人身上治疗，收集数据。一年后收集到12800人的血压数据，进行各种去差异化处理，发现该数据和沿用其他降压药的，要低2%，且没有严重副作用，最后证明该药有效。
        在你的这个例子中，本来药效就不明显，范围扩大后出现数据反常的根本不可能，唯一可以推翻这种可能的，是系统性作弊。所以说RCT唯一的作用，就是对付资本的大规模作弊，提升作弊成本。
        没有前面的生理机制研究，后面的RCT也好，RWS也好全身垃圾。有了生理机制的研究和多角度确认，哪怕统计数据不那么明显，在没有更好的药之前，也可以临时批准，瑞德希韦就是因为这个被FDA批准的。
        就科学工具而言，RCT是垃圾，就反腐工具而言，RCT是神器。
        复 RWS的前提是已知这个药由降血压的生理机制
        家园 反腐神器跟可靠性是一个硬币的两面
        不可靠，是无法作为反腐神器的。
        那么问题来了，难道一个只比垃圾好一点的方法，居然可以成为反腐神器？
        复反腐神器跟可靠性是一个硬币的两面
        家园 反腐制度是科学神器？
        你想一想就明白了。假如世界上的药不赚钱，RC还有这么重要吗？假如药一吃绝大部分都好了，RCT还这么重要吗？
        复反腐制度是科学神器？
        家园 切勿混淆制度与方法
        RCT跟RWS一样，都是方法，反腐的制度选择了RCT，而没有选RWS，说明RCT能鉴别真假，更为可靠。我想问的是：这种可靠性，难道就是比垃圾好一点？
        至于你说的：
        假如药一吃绝大部分都好了，RCT还这么重要吗？
        我的回答是：需要，因为我们需要一个相对准确的数字，这个数字，对研究者来说，很重要。
- 复【原创】关于RCT与RWS
  家园 非常好奇地问个技术问题，西药真的都能实现双盲测试么
  中药存在性状的不同，西药固然没这个问题，药片里是淀粉还是药物，点滴打是不是生理盐水，确实看不出来，算是“盲”的。
  但有一个问题，但凡药物往往都是会引起身体反应的，感冒药可以提纯作为毒品，更不要说化疗的副作用了，在这种情况下，怎么实现受试者的“盲”呢？
  - 复非常好奇地问个技术问题，西药真的都能实现双盲测试么
    家园 一般来说，都能
    “但凡药物往往都是会引起身体反应的”，这话没错。同时，也要注意，非药物（安慰剂）也会引起身体反应。人体就是这么奇怪。
    如果试验设计得好，这种受试者可感知的身体反应是可以“控制”的。
    比如说，I期临床试验就是为了了解药物的安全性、耐受性，得到安全剂量、可耐受剂量。说白了，就是让受试者吃了没啥可感知的副反应。
    还有就是，有的受试者万一真的出现了可感知的副反应，可以通过“控制”分析数据时将其“脱出”。其实他也有可能吃的是安慰剂出现了心理反应。
    其实，药物临床试验并非绝对要求设对照或设盲。
    比如，单臂试验，都知道目前没特效疗法，就是死马当活马医，没必要设对照组，因为对照组都是无效的。
    但是对照组的设置，就是为了剔除安慰剂/自愈，这是RCT的优势。
  - 复非常好奇地问个技术问题，西药真的都能实现双盲测试么
    家园 我的理解绝大部分应该都行
    具体的操作，要问@夕曦 @胶州大白菜等行家才行了。

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明