合伙人招募: 18858102946 客服热线: 400-996-2682
人物专访

梁斐:带你深入浅出正确“读”结果

字号+ 作者:肿瘤资讯 来源:肿瘤资讯 2022-03-25 我要评论

那么,替代终点,如PFS获益,是否可等同于OS获益?PFS获益在何种程度上可以转化为OS获益?如何正确看待PFS和OS结果?

研究终点的设置和选择是临床试验的重要组成部分。近年来,肺癌靶向药物临床试验进展如火如荼,但对于研究终点的选择不尽相同。纵观现有的肺癌靶向药物临床研究,以总生存期(OS)作为主要终点的较少,大多是选择无进展生存期(PFS)、客观缓解率(ORR)等替代研究终点。那么,替代终点,如PFS获益,是否可等同于OS获益?PFS获益在何种程度上可以转化为OS获益?如何正确看待PFS和OS结果?带着这些问题【肿瘤资讯】特邀统计学专家,复旦大学附属中山医院梁斐教授,带我们从统计学角度深入解析PFS和OS的统计学意义及其对于临床应用的影响。

               
梁斐
教授

复旦附属中山医院 生物统计室 统计师
上海抗癌协会癌症预防与筛查委员会委员
CSCO青年委员会统计小组成员
以第一作者或通讯作者在JCO, JNCI, Annals of Oncology, European Journal of Cancer 等杂志发表SCI论著11篇,累计影响因子超过100
以第一作者在NEJM, Lancet, Lancet Oncology, JCO 发表Letter 8篇
JNCI, Clinical Cancer Research, Theranostics审稿人
主要研究方向:临床试验设计及统计,临床研究方法学

OS是临床试验的“金标准”,而实际应用却时常受限

在临床试验中,研究终点的选择是一个非常关键且复杂的问题,与研究目的、监管机构要求、药物作用机制均有关系。晚期临床研究常用的研究终点主要有:OS、ORR、PFS和疾病进展时间(TTP);辅助治疗临床研究中,还会选择无病生存期(DFS)等。其中,OS是以患者为中心的研究终点,是患者获益的直接证据,且具有测量数据精确(可精确到天)、客观(不依赖人的主观判断)等优点,是目前肿瘤临床试验的“金标准”。

梁斐教授指出:虽然OS是疗效评价“金标准”,但是在现实世界中,以OS作为主要终点开展研究往往存在多种局限性:

1)部分瘤种生存期较长,若选择OS作为主要终点,则研究持续时间极长,或影响药物的上市时间。以晚期乳腺癌为例,患者的中位OS已超过8年,同样在非小细胞肺癌(NSCLC)中ALK突变阳性的患者中位OS超过5年,如果在这些瘤种中开展以OS为主要终点的临床研究,则整体研究时间可能会超过10年,大大延缓了药物上市时间,导致广大亟待更新更有效疗法的患者需要等待相当长的时间才可获得有效治疗的机会。

2)以OS作为主要终点需要的样本量大,临床开展难度大。临床试验在计算样本量的时候,对于药物疗效的估计通常会偏保守,如果以OS作为主要终点,则需要较大的样本量。以ALK突变阳性NSCLC临床研究为例,所需样本量可能高达700-1000,大大增加了开展临床研究的难度。

3)OS受后线治疗、交叉治疗影响。如果研究中存在大量Cross-over(交叉)情况,OS结果就会受到后线治疗的稀释,导致很大程度上难以得到有统计学差异的结果,但实际上该结果并不能说明药物没有治疗效果。

4)OS会受非肿瘤原因死亡的影响:OS指从随机化开始至任何原因死亡的时间,由其它并发症、意外交通事故等引起的死亡也是包含在OS之内。

综合以上因素,在临床实践中,往往会采用替代研究终点。美国FDA发布的《抗肿瘤药物和生物制剂临床研究终点指导原则》指出在肿瘤学中,OS是临床获益的金标准;但同时部分可有效预测OS获益的替代终点也可作为临床研究终点。2021年,国家药监局药品审评中心(CDE)发布的《以临床价值为导向的抗肿瘤药物临床研发指导原则》中也指出[1]:对于肿瘤药物,提高疗效和延长患者生存时间仍然是当下追求的主要目标,通常会选择OS作为临床研究的主要终点;可选择与生存获益相关的替代终点作为研究终点。

图1 CDE发布以临床价值为导向的抗肿瘤药物临床研发指导原则通告

目前,FDA对于不同亚型肺癌临床研究的研究终点要求有所不同:对于ALK突变阳性NSCLC临床研究,FDA支持以PFS作为主要终点:即只要观察到具有统计学差异及临床意义的PFS获益,FDA即可批准药物上市;对于EGFR突变阳性NSCLC临床研究,也可以选择PFS作为主要终点;而对于非靶向基因突变的NSCLC,无论是一线还是二线治疗临床研究,均要求以OS作为主要终点,即必须在临床研究中获得显著统计学差异的OS获益才可获得药物适应证的批准。因此不难理解,为什么大多数肺癌靶向临床研究,如ALEX研究,会选择PFS作为主要终点,而OS作为次要终点了。

辩证思维,客观看待OS结果和临床意义

 
 

单一研究OS结果解读

梁斐教授表示:OS结果是否具有统计学差异,不仅取决于疗效,还与研究power、事件数有关。如果研究事件数较多、power较高,即使OS临床获益不显著,也可能观察到有统计学差异的结果。比如,化疗用于NSCLC辅助治疗,其获益并不显著,OS提高仅5%,但却具有显著统计学差异,因其是经过大样本Meta分析而得出的结果。反之,如果样本量较小、power较低,即使OS有显著临床获益,也可能很难获得有统计学差异的结果。

针对OS结果的解读,在众多靶向治疗中,ALK+NSCLC领域因突出的长生存特性,其临床研究很具代表性。以ALEX研究为例,最新公布的数据中mOS仍未达到,HR=0.67,P<0.05,但对比既往公布的HR值可以看到,ALEX研究每更新一次OS结果,其HR值都在逐渐变小——从首次的0.76降为最新的0.67[2,3]——“这说明随着随访时间的延长,阿来替尼OS获益具有更加明显的获益趋势”梁斐教授解读道。

图2 ALEX研究第一次OS结果

图3 ALEX研究最新一次OS结果

也许,HR对于临床医生来说不太直观,大家可能更关心ALEX研究中阿来替尼组中位OS是多少?相比对照组提高了多少?目前由于随访时间还不成熟,尚未观察到中位OS结果。但基于一系列的换算方法,估计相比对照组克唑替尼,阿来替尼中位OS获益可能会超过2年,患者中位OS或超7年。具体估计方法有如下两种:

  1:HR换算法:研究中对照组中位OS是57个月,其HR是0.67,那么以对照组的中位OS/HR值的关系换算估计,阿来替尼中位OS为85个月,相比对照组提高28个月。

  2:5年OS率换算法:阿来替尼5年OS率是62.5%,基于指数分布假设,换算成中位OS是88.5个月,相比对照组提高30个月。

综上,无论采用哪种换算方法,阿来替尼组中位OS获益对比对照组克唑替尼都极有可能超过2年。当然,这是基于一定的统计学模型估计出来的结果,最终OS结果还需要更长的随访时间证实。

 
 

同一药物、不同研究OS结果解读

梁斐教授表示,同一药物、基于不同的研究也很有可能会得到不同的OS结果,而对于导致不同OS结果的原因解读是我们更需要关注的问题。

以颇具争议的ALEX和J-ALEX研究结果为例,两者同样是对ALK突变患者一线治疗,两研究阿来替尼组中位PFS数据比较接近,但OS却有较大差异,ALEX研究获得具有显著统计学差异的OS获益(5年OS率62.5% vs 45.5%,HR=0.67,95% CI:0.46-0.98,P=0.0376),而J-ALEX研究并未获得显著统计学差异结果(5年OS率60.85% vs. 64.11%,HR=1.03,95% CI:0.67-1.58)。抽丝剥茧来看,这一相对矛盾的结果可能是由以下几个因素导致的:

1)不同地区的研究实践会对OS结果有所影响:ALEX研究是一个国际多中心研究,而J-ALEX研究是在日本开展的研究,从研究的广泛性以及结果的可推广性上比较,ALEX研究的OS结果推广性更大

2)同时J-ALEX因日本对于辅料剂量的规定,使用的是300mg 的剂量,与国际使用的600mg有一定差距,可能会对结果产生一定影响

3)两个研究设计不同,导致接受后线治疗的比例差异较大,对OS结果产生了影响:ALEX研究中阿来替尼组与克唑替尼组两组患者在病情进展后接受后线治疗的比例接近(60.7% vs 63.2%)[3]。而J-ALEX研究中这一比例相差较大(91.3% vs 46.6%)其中克唑替尼组和阿来替尼组接受其它TKI作为后线治疗的比例分别为 (82.7% vs 25.2%)[4]

4)克唑替尼未进展换药的影响:J-ALEX研究允许克唑替尼组患者在未出现明显进展的情况下换药,而研究中有部分比例人群因为疗效不显著或不耐受等原因提前停用克唑替尼,换药阿来替尼。由之前的RWD研究可见此类提前换药患者阿来替尼疗效显著,这可能也是导致J-ALEX研究两组患者5年生存率相近的原因之一。

图4 J-ALEX研究最终OS结果

 
 

不同药物研究OS结果的解读

随着肺癌靶向治疗领域踏上快车道,近年来我们时常看到同一个靶点上会涌现出多种新型药物选择,那么面对同一靶点、不同药物间的研究结果,如何正确、客观地解读OS结果显得尤为重要。在ALK突变阳性NSCLC领域中,一些新型ALK-TKI也在不断的更新研究数据。但截至目前,除了阿来替尼之外,其它二代、三代ALK-TKI研究均未观察到有统计学差异的OS结果。对此,梁斐教授表示导致该现象的可能原因有:

1)ALEX研究开展较早,其OS结果比较成熟。其他新一代ALK-TKI研究目前随访时间较短,OS结果还只是一个初步的结果,随着随访时间的延长,是否会得到不同的结果尚需观察等待。

2)ALEX研究PFS获益显著,为其转化成OS获益打下坚实的基础——研究者评估的mPFS相比对照组延长近24个月,这可能是为什么ALEX研究能观察到明显OS获益的重要原因。

3)其他ALK-TKI研究虽然随访时间较短,但公布的HR值较高(恩沙替尼OS HR=0.91[5],塞瑞替尼 OS HR=0.73[6],布加替尼OS HR= 0.82[7]),且OS曲线呈现交叉的状态,可能意味着未来OS数据并不一定十分理想。

综合考量,正确解读PFS结果对OS的影响

与OS相比,PFS研究所需样本量相对较小,所需时间较短,且不受后续治疗的影响。但最近,JAMA Oncology发布的一篇文章指出[8]:以PFS作为主要终点的阳性结果,可能并不一定转化成OS获益——副反应较高的药物可能会在较短的治疗随访时间中获得一个“假性”的PFS获益,而实际上在长期的治疗中很难转化成OS获益。梁斐教授解释道:药物毒副反应是影响PFS获益是否可转化为OS获益的重要因素,因为毒副反应会导致PFS评估本身的偏移,比如部分因副反应中断用药的患者,实际上没有进展,而在中断用药之后很快出现进展,这些患者在统计学上会作为删失处理,不会对PFS结果造成负面影响,但会纳入到OS分析中,对OS产生影响。如果毒副反应特别大,可导致长期随访中患者因为不耐受而停药,使得PFS获益无法转化为OS获益。所以,仅仅PFS结果优越并不代表OS很好,还需要看毒副反应情况。

另外,判断中位PFS是否足够稳健,也可通过中位随访时间进行衡量:中位随访时间超出中位PFS越长,中位PFS越稳健。以ALEX研究为例,截至目前其已公布了三次结果数据,2019年(Journal of Thoracic Oncology,JTO)发布了ALEX研究第二次结果(数据截至2017年12月1日)[9],研究者评估的阿来替尼组mPFS已达34.8个月,让大家看到了“肺癌慢病化“的可能。但对于该结果,梁斐教授在JTO的读者投书(Letters to the Editor)中提出了质疑,认为:此次公布的研究者评估的mPFS(34.8个月)与首次公布的IRC评估的25.7个月有较大差异;且中位随访时间为27.8个月 (范围为:14.05-31.05),最长随访时间低于mPFS;该mPFS数据尚不稳定。

在ALEX研究公布第三次结果之后,梁斐教授对当时的质疑给出了解释:“ALEX研究初期公布研究数据的时候,鉴于其随访时间较短,个人认为其PFS结果尚不稳健——不稳健并不是说PFS被低估或者高估临床获益,只是基于当时的随访时间,其结果可能具有一定的不稳定性。而此次ALEX研究最新公布的研究中,其随访时间已经非常成熟:从最后一个患者入组时间到数据截至时间,其最短的随访时间也已超过中位PFS 34.8个月。因此,ALEX研究目前报道的中位PFS结果(34.8个月)是一个最终的、稳定的结果,对最终OS结果不会产生负面影响。”

图5 ALEX研究最新一次PFS结果

总结

 
 

综上,对于肿瘤临床研究,OS虽然是疗效评价“金标准”,但鉴于其实际应用的局限性,往往采用替代终点,尤其是在如ALK+NSCLC这类患者长生存的靶点中,目前FDA支持采用以PFS作为终点。

 
 

临床实践中,面对OS结果需采用辩证思维,客观看待。

· 对于单一研究OS的解读,不仅要考虑疗效,还需考虑研究power、事件数等多种因素。以ALEX研究为例,虽然最新公布的数据中mOS仍未达到,但HR值相比既往发布的数据进一步降低,显示出随着随访时间的延长,阿来替尼OS具有更加明显的获益趋势,mOS或有可能超过7年。

· 同一药物的不同OS结果,需更加关注背后的的原因。以ALEX和J-ALEX研究为例,两者OS结果的差异,可能是由于后线治疗比例不同、开展地区的研究实践不同、克唑替尼未进展换药因素的影响。

· 同一靶点、不同药物间的研究结果对比需从研究开展时间、HR值等多个方面客观看待比较:依旧以ALK+NSCLC领域为例,近年来除阿来替尼之外,其它二、三代ALK-TKI研究均未观察到有统计学差异的OS结果,背后的原因可能是ALEX研究开展早, OS结果已较成熟;同时PFS获益显著,为转化成OS获益打下坚实的基础;其他ALK-TKI研究虽然随访时间较短,但目前公布的HR值较高,且OS曲线呈现交叉状态,意味着OS数据并不一定十分理想。

 
 

PFS是否可转化为OS获益,需要从不良反应发生率、随访时间等多个方面综合考量。作为首个ALK-TKI头对头Ⅲ期临床研究,ALEX研究虽以PFS作为主要终点,但最新公布的研究结果中位PFS相比既往结果更加稳健,显示随着随访时间延长,获益有更加明显的趋势。

 
 

目前,ALEX研究的OS结果已经非常接近达到统计学的显著性,但最终结果如何仍要更长的随访时间,值得期待! 

健康城市是世界卫生组织在1994年给健康城市的定义。是一个不断开发、发展自然和社会环境,并不断扩大社会资源,使人们在享受生命和充分发挥潜能方面能够互相支持的城市。上海复旦大学公共卫生学院傅华教授等提出了更易被人理解的定义:“所谓健康城市是指从城市规划、建设到管理各个方面都以人的健康为中心,保障广大市民健康生活和工作,成为人类社会发展所必需的健康人群、健康环境和健康社会有机结合的发展整体。
 
我淘健康以大数据助力“健康中国”建设为理念,以“全民健康”建设为目标,提高全民健康素养,提升健康城市建设效果,以健康城市发展指数为依据,普及健康城市建设标准,加快推进实施“健康中国”战略。

 
 
 
我淘健康京智康打造海悦花园健康社区新样板
 
京智康助推“健康社区+健康小屋”数字化建设
 
我淘健康引领健康城市服务落地实践

转载请注明出处。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.作者投稿可能会经我们编辑修改或补充;
3.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任。
4.本站转载文章仅作行业分享,版权归原作者,如有侵权请联系(cccrea_service@wotaotao.com),我们会在第一时间删除;

相关文章
  • 梁斐:从统计学视角解读CheckMate-649研究及中国亚组数据

    梁斐:从统计学视角解读CheckMate-649研究及中国亚组

  • 步宏:实体肿瘤PD-L1免疫组织化学检测专家共识与实践

    步宏:实体肿瘤PD-L1免疫组织化学检测专家共识与实