根据《体外诊断试剂注册管理办法》第二十八条的规定,体外诊断试剂临床评价是指申请人或者备案人通过临床文献资料、临床经验数据、临床试验等信息对产品是否满足使用要求或者预期用途进行确认的过程[1]。管理办法的制定引入了IMDRF(原GHTF全球医疗器械协调工作组)对医疗器械临床管理的新概念和思路,其中临床文献资料、临床经验数据、临床试验都是获取临床数据的形式,从而提供临床证据。
临床评价是数据收集、数据鉴别、数据分析的一个过程,然而由于体外诊断试剂的原材料、工艺、方法学的差异,导致同品种不同厂家的产品很难通过临床文献、经验数据进行比对,即无法证明产品的等同性。因此,在我国体外诊断试剂的现行法规下,临床评价是指提供临床证据的过程或形式,目前提供临床证据的形式只有2种途径,即通过临床机构进行的临床试验和申请人自行选择符合要求的单位进行的非临床试验的临床评价。本文主要针对需要进行临床试验的临床评价情况进行讨论。
国家药监局通过制定并适时调整《免于进行临床试验的体外诊断试剂目录》来划分产品的临床评价途径。值得注意的是,免临床目录中的产品并不一定可以免于临床试验:①根据免临床的目录的规定,预期用途为患者自测或新生儿检测相关的产品,不属于免于进行临床试验的产品范围。②在免临床目录,但预期用途与目录中的预期用途相差大或为全新的方法学,则亦不属于免临床试验范围[2]。
2018年1月,国家药品监督管理总局组织制定并发布了《接受医疗器械境外临床试验数据技术指导原则》,此指导原则为申请人增加了一个临床试验数据的补充形式,但应充分考虑技术审评要求、受试人群及临床试验条件的差异,并在提交境外临床试验数据前,与审评部门进行充分沟通,对数据的科学性、充分性等作出判断,以确定是否可用于此次临床试验数据的补充[3]。
为了鼓励更多医疗机构参与医疗器械临床试验,释放临床资源,增加临床试验机构的数量,更好地满足医疗器械临床试验的需求,鼓励医疗器械产品创新、促进医疗器械产业健康发展,原国家食品药品监管总局和原国家卫生计生委联合发布了《医疗器械临床试验机构条件和备案管理办法》。根据《总局办公厅关于做好医疗器械临床试验机构备案工作的通知》(食药监办械管[2017]161号),自2019年1月1日起,医疗器械(包括体外诊断试剂)临床试验申办者应当选取已经在备案系统备案的医疗器械临床试验机构,其中的特殊要求为对于列入需进行临床试验审评项目的第三类产品需要临床机构为三级甲等医院,主要研究者应参加过3个以上医疗器械或药物临床试验。除了对临床机构的资质有明确规定外,申请人还应考虑临床机构的能力,如拟评价的项目开展情况,是否有充足的样本来源,被考核试剂、对比试剂及配套设备,是否经过了此项目的室间质评等。
无论是需要进行临床试验、还是免于进行临床试验的临床评价,都会面临选择何种比对试剂或参考方法进行比较。体外诊断试剂在进行临床试验时一般采用被考核试剂与临床参考标准和/或已上市同类产品进行比较研究的方法,评价被考核试剂的临床性能,为该产品安全性、有效性的确认提供科学有效的临床证据。
对于非新研制产品,可选择与已上市同类产品进行比对。“已上市同类产品”指的是境内批准上市的同类产品。这类产品在选择时首先应考虑可比性,可比性是进行临床比对的前提,而可比性一般指方法学不低于待评价产品或与待评价产品较为接近的,溯源性相同,参考区间相近的产品,除此之外还应考察比对产品与待评价产品是否具有相同的预期用途(样本类型、目标人群、临床判断)。而对于联检类产品,或涉及多个指标同时检测的产品,如自身抗体谱类产品,如比对产品不足以涵盖申请产品的项目时,可以考虑增加另外的比对产品,使得比对产品的总体检测项目涵盖申请产品。
总局办公厅关于规范医疗器械产品分类有关工作的通知中指出新研制产品是指未在我国境内上市的全新产品,与已上市产品相比,产品的技术原理、结构组成、使用部位或技术特点、预期目的等发生了影响产品分类的实质性变化[4]。这类产品应与临床“金标准”进行比对。对于目前临床上没有可参照的临床参考标准或现有临床参考标准不能全面评价产品临床性能的情况,临床试验设计时,在确认被测物临床检测意义的前提下,还应依据现有临床实践和理论基础选择适当的实验室方法进行检测性能评价,与临床公认的、标准化的实验室参考方法进行对比试验。如果有境外已批准上市的同类产品,应谨慎选择。比如国内产品上市前的注册认证与欧盟等国家的认证体系不同,对产品的风险分类及管理要求存在差异,不能单纯以取得欧盟CE认证为依据而作为比对产品,要仔细分析比对产品是否具有相同的预期用途,且该产品经过了充分的性能验证和确认。实验室检测过程中可实现良好的质量控制,并被临床广泛认可能够用于相关标志物检测,则该产品亦可将实验室检测方法用作对比方法。
体外诊断试剂的临床试验或免于临床试验的临床评价都涉及临床样本的入选,入选应有严格的入组标准,并受产品的预期用途、性能指标等的影响。而申请人往往在样本入选时流于形式,造成入选的样本评价不够充分或不相匹配。
所有产品的注册申报资料中都应包含对预期用途的说明,预期用途应描述医疗器械产品基于何种原理机制,在临床应用上达到何种预期作用[5]。体外诊断试剂的预期用途是指产品的一般用途或功能,包括样本类型、被测物和适应症等。适应症是指体外诊断试剂诊断、预防、预测、治疗监测或预后观察的疾病或状态,包括适用人群。而对于体外诊断试剂而言,预期用途从宏观上可以分为如:①对用于早期诊断、疗效监测、预后判断等用途的体外诊断试剂。如用于疗效监测的试剂,应针对同一患者不同时期进行取样;用于预后判断的试剂,应提供随访期的诊断信息。②对于试剂检测结果有明确疾病指向的产品,其纳入的病例应有临床明确诊断信息,如超敏C反应蛋白,临床上主要针对主要用于评价心血管疾病风险,这时纳入的样本类型主要为具有心血管疾病的人群。再如新型冠状病毒检测试剂,入组人群应为疑似人群、确诊/排除病例,不应入组无相关病例。此外入组的样本类型应与说明书声称一致,而对于涵盖不同样本类型的,在比对过程中还应注意不应超出比对试剂的样本适用类型。
临床试验,也是对产品性能的验证,因此纳入的样本应尽量足够并有效,如样本浓度应覆盖整个线性范围,并均匀分布,阳性样本量一般要求30%~50%。根据其流行病学特征,针对发病率较低疾病的产品,可酌情减少阳性样本量。此外,还应考虑医学决定水平处附近的样本分布,如高敏/超敏肌钙蛋白的临床试验,目前临床上已达成共识认可高敏肌钙蛋白在急性心肌梗死诊断的临床应用价值,高敏对AMI的诊断价值要优于传统cTnI,有更高的敏感度,可作为快速诊断的筛查。因此其更低的检出限及更低的cut-off值对申请该产品的意义显而易见。然而如果该产品检测范围很宽,临床上存在很多高值的样本,在分析cut-off值附近的医学决定水平处的偏倚分析时,由于高值样本对低临界值偏倚计算过程的回归标准误差产生较大影响,最终造成低临界值的偏倚过大,因此在入选样本时应考虑入选更多低值附近的样本。由于临床样本成分的复杂性,产品对干扰物的表现是评价产品性能的重要内容之一,应在临床比对过程中纳入干扰样本,关于干扰样本的研究,美国EP7-A2做了具体的介绍,干扰的涵盖范围广,包括内源性、外源性、干扰物、基质效应、交叉反应相似物、抗凝剂等,这类样本应在性能研究中进行还是需要在临床试验、比对中予以呈现,如需纳入临床样本中,需要纳入何种干扰,以及纳入多少,至今并没有具体的执行标准。
一直以来体外诊断试剂临床试验的例数一直是个值得讨论的问题。2015年发布的《体外诊断试剂临床试验技术指导原则》中对例数有明确规定,然而这些仅仅是针对例数要求的一个最低要求,绝不是充足条件。体外诊断试剂临床试验的样本量与多种因素相关,如产品的预期用途、样本分层设计、检测的可重复性、干扰因素、亚组间的差异性以及被测物特点,预期达到的灵敏度、特异性等,因此样本量的估算应该视具体产品而定。在《体外诊断试剂临床试验指导原则(征求意见稿)》中对样本量已不做硬性规定,由企业自行计算满足临床统计学要求的样本例数,这一理念的转变更加趋于科学化。
基于临床试验的比对结果,建议对所有产生的数据进行分析,而不是简单的罗列,对试验中所有不一致结果均应结合患者的流行病学背景、临床症状等信息进行充分的分析。具体的统计方法可参照2013年8月CLSI发布的EP9-A3《用患者样本进行方法学比对及偏移评估——批准指南;第三版》文件,首先充分运用差异图进行数据观察,数据具有恒定的SD还是CV,亦或是混合的模式,根据数据特点再选择更合适的回归分析方法,包括加权的使用,戴明回归、PassingBablok,然后针对不同差异图进行偏倚分析,并应重视医学决定水平处或参考值附近的偏倚评估。
临床评价是各个国家和地区推动医疗器械创新研发、加快产品上市进程中关注的共同话题。2018年中国作为IMDRF轮值主席国,积极参与了临床评价项目的工作,借鉴汲取国外最前沿的审评理念和监管思路,也出台了一系列指导文件,比如《接受医疗器械境外临床试验数据技术指导原则》《真实世界数据用于医疗器械临床评价技术指导原则(征求意见稿)》《免于进行临床试验的体外诊断试剂同品种比对技术指导原则(征求意见稿)》等,进一步使医疗器械临床评价科学化、合理化、规范化。
作者:刘露 来源:中国医疗器械信息
单位:国家药品监督管理局医疗器械技术审评中心