临床研究
抗肿瘤药物临床试验终点技术指导原则介绍
 一、概述

  临床试验终点(End Point)服务于不同的研究目的。在传统的肿瘤药物的研发中,早期的临床试验目的是评价安全性以及药物的生物活性,如肿瘤缩小。后期的有效性研究通常评价药物是否能提供临床获益,例如生存期延长或症状改善等。

  用于支持药物批准的临床试验终点通常应当是反映临床获益的指标。在肿瘤领域,生存期改善被认为是评估某种药物临床获益的合理标准。在20世纪70年代,通常以影像检查或体检等肿瘤评估方法测得的客观缓解率(Objective Response Rate ,ORR)为依据批准抗肿瘤药物上市。在随后的数十年里,逐渐认识到抗肿瘤药物的审批应该基于更直接的临床获益证据,如生存期改善、患者生活质量提高、体力状况或肿瘤相关症状减轻等。这些临床获益很多时候并不能通过客观缓解率或与其相关的指标进行预测。

  当某种药物用于治疗严重或威胁生命的疾病、对现有治疗有明显改进、或填补治疗空白时,在一定条件下可采用替代终点(Surrogate End Point)支持该药物的上市申请。这些替代终点可能不像血压或血清胆固醇这类经过充分验证的指标,但可能能合理预测临床获益。此种情况下,申请人必须承诺进行上市后临床试验以确证该药物的实际临床获益。如果上市后研究不能证明该药的临床获益,或者申请人未按要求进行承诺的上市后研究,则国家食品药品监督管理局(以下简称SFDA)可将该药物从市场中撤出。

  本指导原则的目的是为申请人开展抗肿瘤药物临床试验终点指标的选择提供参考,以使其符合某种药物上市申请的有效性评价要求。本指导原则主要适用于国内、外均未上市的抗肿瘤新化合物的临床试验研究,新生物制品也可参考部分内容。本指导原则中仅讨论用于治疗肿瘤患者的药物的终点,未讨论用于预防或降低肿瘤发生率的药物的终点。

  二、关于临床试验终点的一般性考虑

  本节回顾了抗肿瘤药物研发中的一般性问题。对常用的抗肿瘤药物临床试验终点进行了探讨,并对采用了这些终点的肿瘤临床试验设计中的相关问题进行了讨论。本节中将讨论的临床试验终点包括总生存期(Overall Survival ,OS)、基于肿瘤测量的终点如无病生存期(Disease-Free Survival ,DFS)、ORR、完全缓解(Complete Response, CR)、疾病进展时间(Time to Progression ,TTP)、无进展生存期(Progression-Free Survival ,PFS)和基于症状评价的终点。(一)总生存期

  总生存期定义为从随机化开始到因各种原因导致病人死亡之间的时间,且是按意向治疗人群(ITT)计算。这个终点精确可测,并有死亡日期提供依据。在终点评估时不会出现偏倚。生存期是迄今为止评价抗肿瘤药物最可靠的临床试验终点,当研究能充分评价生存期时,它通常是首选终点。

  总生存期应在随机对照研究中评价。对于这类时间依赖性终点(例如OS、PFS)的历史研究中的数据极少可信。历史研究中对照组和目前治疗组间除使用药物治疗不同外,其他因素的差异还包括病例的选择、影像技术或支持治疗的改善,都将导致结果出现显著差别。随机化研究通过进行直接结果的比较,可将这些差别最小化。如果药物的毒性可以接受,总生存期显著的改善可视为有临床意义,通常能支持新药的上市批准。

  生存期研究实施和分析中存在的困难包括大型试验随访期较长,以及随后的抗肿瘤治疗可能会混淆生存期的分析。

  (二)基于肿瘤测量的临床试验终点

  在本节,将讨论几种基于肿瘤测量的临床试验终点。这些终点包括无病生存期(DFS)、客观缓解率(ORR)、疾病进展时间(TTP)、无进展生存期(PFS)和治疗失败时间(TTF)。所有时间依赖性终点的数据收集和处理均基于间接的评价、计算或估算(如肿瘤的测量)。关于无进展生存期数据收集和分析的讨论见附3。

  当选择基于肿瘤测量的临床试验终点时,应针对该终点在抗肿瘤药物临床获益评价中的不确定性和偏倚进行评估。在不同的肿瘤试验中,研究者对肿瘤测量的精确性相差甚远。此外,如果肿瘤没有明确边界(例如恶性间皮瘤、胰腺癌和脑瘤),使用肿瘤测量方法获得的缓解率可能是不精确的。药物上市申请时如果采用基于肿瘤测量的临床试验终点作为有效性的唯一证据,那么通常应提供来自第二个试验得到的确凿证据。

  如果主要研究终点是选择基于肿瘤测量的终点指标(如PFS或ORR),通常应由对研究治疗分配处于盲态的独立终点审查委员会验证该终点指标的评价(见附4)。如果试验本身未设盲时,这种由独立的第三方进行的盲态下的测量特别重要。SFDA可能会抽查部分资料进行监察以核实独立终点审查委员会的审阅程序。其他关于资料收集的细节见附件1。当随机研究采用盲法(除非发生不良事件使得研究实际上已被揭盲)或者在大型随机研究中效应值是稳健的,并且敏感性分析证明未发现观察者的偏倚(尤其是针对DFS),基于肿瘤测量的终点指标评价(尤其是PFS或DFS)可不需要进行集中独立审核。

  1.无病生存期

  无病生存期(DFS)通常定义为患者从随机分组开始到出现肿瘤复发或由任何原因引起死亡之间的时间。该终点最常用于根治性手术或放疗后的辅助治疗的研究。如果某些疾病(例如血液肿瘤)在大部分患者化疗后达到完全缓解时,DFS也可以作为一个重要终点。尽管在大多数辅助治疗的情况下,总生存期仍然是一个传统的终点指标,但是当生存期延长而使得选择生存期为临床试验终点不现实的时候,DFS可以作为一个重要的终点指标。目前DFS已经成为乳腺癌辅助性激素治疗、结肠癌辅助治疗、以及乳腺癌的辅助性细胞毒治疗的主要审批基础。无疾病生存期可以是临床获益的替代终点或者可以为临床获益提供直接证据。这一决定取决于疗效大小、风险-效益关系以及疾病情况。

  如果将DFS作为一个可能终点,需要考虑的重要问题包括估计的疗效大小和已经证明的标准治疗方法的获益。试验方案应详细说明DFS的定义以及随访研究和随访的时间安排。许多原因可能导致计划外评价,各试验组之间计划外评价的频率、时间和原因存在差异,而这些差异可能会导致偏倚。如果可行,可通过研究者和患者的双盲操作,使这种潜在的偏倚最小化。可以通过对随访期间事件发生的总数(不管事件发生的时间)进行比较分析,从而评估由于计划外的评价而产生的可能偏倚影响。

  无病生存期的定义可能比较复杂,尤其是当死亡发生而没有预先对肿瘤进展情况进行记录时。这些事件可记录为疾病复发,或作为删失的事件。尽管所有关于死亡的统计分析方法均有一定的局限性,但将所有原因导致的死亡均认为是由疾病复发所致可以将偏倚降至最低。这种定义的局限性在于高估了DFS,尤其是对于长期失访后死亡的患者。如果在各研究组中长期随访的频率不一致或是因为药物毒性而产生的非随机脱落,将会产生偏倚。某些分析将肿瘤相关死亡认为是DFS事件,并删失了非癌症死亡病例,这种方法可能在判断死亡原因时产生偏倚。另外,任何删失患者的方法(无论是针对死亡还是末次随访)都会认为被删失的患者与未被删失的患者具有相同的复发风险。

  2.疾病进展时间和无进展生存期

  疾病进展时间(TTP)和无进展生存期(PFS),TTP定义为从随机分组开始至出现肿瘤客观进展之间的时间;TTP不包括死亡。PFS定义为从随机分组开始至出现肿瘤客观进展或死亡之间的时间。关于肿瘤进展的明确定义非常重要,应在方案中进行详细描述。

  2.1 TTP和PFS

  与TTP相比,PFS是更常选用的替代终点。因为PFS包括死亡,更好地反映了受试药物的毒副作用,因此与总生存期有更好的相关性。在对TTP的分析中,无论是在死亡时还是相对较早的随访期间,死亡均被删失(试验中的非随机脱落)。PFS可假设患者的死亡与肿瘤进展有着随机的联系。然而,当大多数死亡与癌症不相关的情况下,TTP也可以是一个合适的终点指标。

  2.2 PFS作为支持药物审批的终点

  上表列出了用PFS作为支持抗癌药物审批终点的优点和缺点。PFS反映了肿瘤的生长,又可以在证实生存期获益之前进行评价。不会受到后续治疗的混淆。对于预定的样本量,PFS受到的影响可大于总生存期受到的影响。然而对于许多不同种类的恶性肿瘤来说,正式确认PFS作为生存期的替代终点是比较困难的。通常没有足够的数据对生存期和PFS的相关性进行评价。抗肿瘤药物临床试验规模通常较小,已有药物的生存获益通常比较小。在不同的抗肿瘤治疗试验中,用于支持审批的PFS终点所起的作用是不同的。无进展生存期的延长是否直接代表临床获益或仅是临床获益的替代终点,取决于这种新治疗方法的疗效大小以及与现有治疗相比的风险-效益比。

  2.3 PFS试验设计问题

  在试验方案和统计分析计划(SAP)中应详细描述评价、测量和分析PFS的方法学。同样,在试验方案中仔细对肿瘤进展标准进行定义也很重要。现在还没有法定标准对肿瘤进展作出定义,申请人可能使用不同的标准,包括RECIST标准。除了公认的PFS标准中列出的大纲,试验方案和统计分析计划应增加其他细节。在两个试验组中,随访和影像学评价必须是均衡的,以避免系统偏倚。研究应尽量采用盲法。如果将患者或研究者评价作为进展终点的一个因素,则设盲显得尤其重要。至少,应由处于盲态的独立裁定小组(independent adjudication team,一般包括影像学家和临床医师)进行评价。SFDA和申请人应在以下方面提前达成一致意见:

  ● 研究设计;

  ● 疾病进展的定义;

  ● 记录在CRF表上的数据;

  ● 统计分析计划(SAP);

  ● 缺失数据的处理办法和数据删失办法;

  ● 如适用,独立终点审核委员会(IRC)的操作规程(见附件4)。

  2.4 PFS的分析

  由于有数据缺失等现象,PFS的分析变得比较困难。试验方案中应针对每位患者对“一个充分的评价随访(即,在此次随访中完成了所有约定的肿瘤评价)”给予定义。分析计划应总结比较各治疗组的随访充分性。方案应详细说明如何分析不完整和/或缺失的随访数据,以及数据删失的方法。分析计划应明确说明主要分析,以及一个或多个敏感性分析,以评价结果的可靠性。虽然所有含缺失数据的分析都存在一定问题,但只要敏感性分析和主要分析都支持结论,那么结果就是正确的。评价中应该包括长期失访患者的死亡人数。这类死亡会造成高估了随访较少的组的PFS,从而导致PFS的测定产生偏倚。

  由于可以从多个时间、多种来源获得病情进展数据(包含计划外随访的身体检查和各种类型的影像学扫描),因此每次评价随访进行的数据收集有必要在随访前后限定的较短时间内进行。在较长时间内收集数据时,难以确定事件日期和删失日期。建议:如果之前不存在缺失的评价,将最早观察到病情进展的时间标记为进展日期,并将确定无进展的末次影像学评价日期确定为截止日期。附件3提供了一套主要分析或敏感性分析中可用于PFS的表格,建议在Ⅱ期临床试验结束后与SFDA讨论PFS数据的收集和分析计划,在专门的方案评估中进行核实。

  3.客观缓解率

  客观缓解率(ORR)是指肿瘤体积缩小达到预先规定值并能维持最低时限要求的患者比例。缓解期通常是指从开始出现疗效直至证实出现肿瘤进展的这段时间。一般定义客观缓解率为完全缓解加上部分缓解之和。客观缓解率是一种直接衡量药物抗肿瘤活性的指标,可以在单臂试验中进行评价。疾病稳定不应该是客观缓解率的组成部分。疾病稳定可以反映疾病的自然进程,而肿瘤缩小则是直接疗效。同样,疾病稳定可通过TTP或PFS分析进行更精确的评价。如果可能,应采用标准化的指标以确定疗效,如RECIST标准。缓解标准应在试验开始前的方案中提前定义。客观缓解率的评估包括缓解程度、缓解持续时间以及完全缓解率(没有可测量到的肿瘤)。

  4.治疗失败时间

  治疗失败时间(TTF)是一个复合的终点指标,即从随机化开始到无论何种原因(包括疾病进展、治疗毒性和死亡)导致治疗终止之间的时间。一个合理的支持审批的终点指标应当能清楚地将有效性和药物毒性、患者或医师退出、或患者不耐受区分开,TTF不能将有效性与其他变量进行充分区分。因此,不建议将TTF作为支持药物批准的终点。

  (三)基于症状评估的临床试验终点

  症状和体征的改善通常被认为是临床受益,如体重的增加、疼痛的减轻或止痛药用量减少等。主要可用于盲法、多数患者有症状、无有效治疗药物和较少做影像评估的试验的疗效评价指标。在非盲法试验中则容易受到主观因素的影响,导致结果偏倚。当以症状和体征的改善作为支持抗肿瘤药物审批的主要终点时,应当能够区分是肿瘤相关症状的改善还是药物毒性的减小或缺失。

  患者自评结果(Patient Reported Outcome ,PRO)是直接来自患者的关于其健康状况的报告,而非来自临床医生或其他任何人,可作为反映症状获益的恰当评价方法。但有一定局限性,研究者和受试患者报告中可能存在很大差别,问卷信息收集的时间点也会有影响,语言因素也会导致不能准确评估。生活质量评分(Quality of Life, QOL)也可以用来评估与健康相关的生活质量。但应当注意,以QOL来衡量药物的结果可能只能说明某种药物相对其他药物来说毒性较小,但并非其有效性更好。

  设计适宜的详细的评估量表是准确评估药物作用的基础,不应仅仅提供“出现或未出现”这样的数据。用于抗肿瘤药物临床试验效果评价的量表必须经信度(reliabitlity)和效度(validity)分析,且是学术界认可的。量表中各项目的评价应尽可能采用定量或等级来反映观察项目变化的程度,应尽可能避免采用“是或否”、“出现或未出现”这样的二分类数据。

  由于毒性或肿瘤进展而终止对受试者的评价,导致数据丢失,这种情况在抗肿瘤药物临床试验中较为常见。数据的丢失会导致评价的困难。因此,在试验方案中应有相应的措施尽可能避免或减少数据的缺失。

  1.特定症状终点

  与“疾病进展时间(TTP)”相似,“癌症症状进展时间(Time to progression of cancer symptoms)”是临床获益的直接测量指标而不是替代终点。如上文所述,疾病进展测量中存在的问题(例如评估缺失)同样存在于“症状进展时间”的评估中。在非盲的试验中可能导致评价偏倚。其次,肿瘤的发展和肿瘤相关症状开始之间会出现间隔。往往在达到症状终点前,治疗就进行了调整,从而混淆了分析结果。此外,许多抗肿瘤药物的试验中采用的是肿瘤相关症状很轻的患者。而且很难将肿瘤相关症状和药物毒性区分开。

  复合症状终点的中的某一症状指标应当具有相似的临床重要性,并且其结果不应当仅仅归因于一个指标。例如,基于复合终点批准用于治疗肿瘤骨转移患者的药物,与骨骼相关的事件被定义为病理性骨折、骨放射治疗、骨外科手术和脊髓压迫。

  选择恰当的研究人群是证明症状方面获益的关键。对于在研究基线时即有症状的患者,可利用分类的症状缓解分析评价。对于在基线时无症状的患者,应分析“首次发生症状的时间”。即使患者终止使用研究药物或开始使用一种新药,如果随访持续到首次出现症状,仍可评价症状的进展。

  2.症状数据面临的问题

  数据缺失以及评价不充分可能使症状数据的评价更复杂,特别是对于开放性研究而言。因药物毒性或肿瘤进展而退出研究是症状数据丢失的一个原因。理想的情况是,当患者停止治疗时应该继续收集可供分析的信息。基于多样性考虑,应进行多种症状的前瞻性数据收集,并且需要在SAP中详细说明必要的统计学修正。

  (四)生物标志物 (Biomarker)

  尽管目前许多生物标志物已经作为临床观察肿瘤反应和进展的监测指标,比如CA-125用于卵巢癌,PSA用于前列腺癌的观察,血液和尿液中异常蛋白水平用于骨髓瘤缓解评价。但尚需要做进一步的研究证实现有测试方法的可靠性,并确定生物标志物改善是否能预测临床获益。因此,目前生物标志物不能单独作为上市批准的依据,SFDA可以接受肿瘤标志物作为复合终点的一个指标。例如在卵巢癌患者中,伴随CA-125上升的某些特定临床事件(如体力状况明显下降或肠梗阻)可反映患者病情进展。此外,生物标志物还用于确定预后因素、患者选择,以及在试验设计中需要考虑的分层因素。提倡保留肿瘤部分组织、体液或血清样本等以进行相关标志物的研究检查。

  三、临床试验设计考虑

  新药上市必须基于“充分且良好对照的研究”的有效性证据支持。研究必须与一个对照组进行比较,必须就药物的疗效提供足够充分的评价。用于证明有效性的最可靠的方法是,在盲法随机对照试验中,显示出有统计学意义和临床意义终点指标的改善。下面我们将讨论几个关于支持药物上市的抗肿瘤药物临床试验设计的问题。

  (一)单臂试验

  在当前没有其他治疗方法的情况下,并且据推测肿瘤的明显缩小可归因于试验药物,SFDA有时会接受在单臂研究中所观察到的客观缓解率和缓解持续时间作为支持审批的证据。例如在急性白血病等疾病中,可以使用缓解率作为支持审批的终点指标,因为在这些疾病中,完全缓解与输血需求量减少、感染降低和生存期增加相关。因为各种类型肿瘤的自然进程变异性很大,单臂试验不能充分体现时间-事件终点,如生存期、TTP和PFS。因此如采用时间-事件终点指标时,需要进行随机对照研究。

  (二)非劣效性研究

  非劣效性(Non-inferiority)试验的目的是通过一个预先规定值(非劣效性界值)论证一个新药的疗效不低于标准治疗药物。非劣效性界值是指疗效的降低必须在临床可接受的范围内,且不得超出阳性对照药的效果。标准治疗药物必须有明确的临床获益(生存获益)。如果一个新药的疗效低于阳性对照药疗效的程度超出了非劣效界值,则可推断该新药是无效的。

  非劣效性试验是基于外部(历史性)数据确定阳性对照药物的疗效大小。在抗肿瘤药物试验中,通常没有充分数据描述该疗效。非劣效性试验还依赖于一个恒定的假设。该假设包括:历史研究和当前研究中阳性对照药的疗效是恒定的。阳性对照药的有效性来源于历史数据和当前试验,这一假设包括两者均具有同样的患者人群特点、支持治疗方法、评价方法。阳性对照药疗效的估计值应基于对历史研究进行全面的荟萃分析。这些研究应重新证实与安慰剂相比阳性对照药的有效性。实施非劣效性试验的困难包括如何评估阳性对照药疗效大小以及确定需要保留的效应值(非劣效界值)。与优效性试验相比,非劣效性试验通常需要更多的病例,并且涉及到临床试验结果的重现性。此外,后续治疗和交叉到阳性对照药组可以干扰各种非劣效性分析。使用生存期之外的其他终点的非劣效性试验,对结果的解释是存有疑问的。

  (三)放疗保护剂和化疗保护剂的试验设计

  放疗保护剂和化疗保护剂是专门用于减轻放疗或化疗毒性的药物。这些药物的试验评价通常有两个目标。一是评价保护剂是否达到预期减轻放疗或化疗毒性的目的。二是确定保护剂是否危及抗肿瘤疗效。可采用替代终点检验第二个目的,如客观缓解率(ORR)或者至肿瘤进展时间(TTP),而非总生存期。

  四、结语

  本指导原则的总体原则是帮助申请人选择上市申请的终点,同时鼓励申请人在申报支持新药上市方案的之前和SFDA进行讨论,以探讨用于支持药物上市申请的终点和方案设计的可行性。

  最后,上市审批并不仅仅取决于临床试验设计,还取决于药物上市申请中所有研究结果和数据。

全国服务热线:

400-9905-168

关注我们

粤ICP备13059948号 广州格慧泰福(GHTF)生物科技有限公司 版权所有