无创产前检测的现状与前景
基于母体外周血胎儿游离DNA(cell-free fetal DNA,cffDNA)和高通量测序(Next-generation Sequencing,NGS)等技术的无创产前检测(Non-invasive prenatal testing,NIPT)正成为目前应用最为广泛的临床高通量基因检测技术应用。继1997年发现孕妇外周血中存在cffDNA后[1],香港中文大学的卢煜明(Dennis YM LO)教授团队在2008年提出了应用NGS对cffDNA进行检测从而评估唐氏综合征风险的方法[2],即NIPT。自此至今的十多年里,NIPT逐步得到了临床上的验证和技术上的发展。本文将从多个维度来介绍和剖析NIPT技术发展的现状,并思考和评估NIPT技术发展的前景。
本文将从三个角度剖析NIPT产业的发展方向,包括:(A)技术研发;(B)应用发展趋势;(C)临床科研合作。
NIPT的技术研发
NIPT的技术研发,首先要基于对应的技术平台。目前主流的NIPT是基于NGS技术的,主要分为illumina的基于可逆荧光终止子技术的测序平台以及thermofisher scientific的离子电压半导体技术的测序平台。前者的技术代表,在国内是以贝瑞和康的贝比安为主,国外有illumina的Verifi(收购自Verinata)[3]、natera的Panorama[4]和Sequenom(现Integratedgenetics)的MaterniT21 PLUS[5];后者的技术代表,在国内是达安基因(达瑞健康)的无创产前检测、博奥检验的诺儿康[6],国外有PremaItha的IONA[7]等。除此之外,华大的NIFTY[8]和NIFTY全因可基于多个NGS平台,包括基于原CG(Complete Genomics)的高通量三代测序平台,而国内还有天昊诊断的基于毛细管电泳的一代测序平台的NIPT技术,在国外有Roche旗下Ariosa为避免专利问题而重新研发的基于微阵列芯片技术进行DNA捕获的Harmony[9]。不同的技术平台,其NIPT的技术研发思路和发展前景是截然不同的。
基于NGS的NIPT技术研发
主流的基于NGS的NIPT技术研发,基本原理在于分析cffDNA的拷贝数变异(CNV)。最初Dennis LO团队在检测胎儿21号染色体三体时采用的是read count的CNV分析辅以Z-test作为显著性差异检验[2],后续在13/18号染色体三体的研究中增加了对GC含量进行read count校正的方法[10]。这种Z-test属于baseline Z-test,即与阴性样本参考库的分布进行比较,这个阴性样本read count均值即为baseline value。实际上根据这个参考值的不同,可以有多种Z-test。华大的张秀清等人提出了以样本自身内部长度接近的染色体read count值作为参考值进行Z-test[11],即internal chromosome。达瑞健康的NIPT则采用了以样本自身中值作为参考值,再与阴性样本参考库进行比较。上述3种Z-test都是常规的NIPT算法基础,目前市场上绝大多数的胎儿染色体非整倍体检测的NIPT产品都是在这个算法基础上进行完善。另一NIPT始创团队Stephen Quake在当时采用的是相关性分析和T检验[12]。
图1 基于read count的NGS NIPT的方法原理[2]
华大的NIFTY文章中,除了对阴性样本参考库的比较外,增加了对该样本可能存在的阳性情况的比较,即加入了对胎儿比例的考虑,并将两者的Z值相除得到L值,对L值进行T分布检验来判断结果[8]。这个考虑了胎儿比例和阳性情况的算法有助于提升NIPT的准确性。另外有欧洲的研究团队提出了对Z值再进行Z检验得到ZZ值,并同时采用Z值和ZZ值进行分类比较,来降低假阴性和假阳性[13]的发生。但这种方法在判定上过于累赘,而且受阴性样本库质量的影响。达安临检最近发表的文章中,提出了使用支持向量机(SVM)辅助NIPT判定的方法,通过对上述3种Z检验在阴性和阳性预测上的6种Z值结果,加上样本的临床指征作为机器学习的参数,训练出SVM模型来进行判定,有效提升准确率的同时降低约3%的灰区重测成本[14]。使用机器学习算法和人工智能深度分析,有望成为未来1-3年内提升NIPT准确性的发展方向。
对于基于read count的NGS NIPT技术,在实验环节上无论是illumina还是ion torrent平台,PCR扩增都是一个影响DNA真实拷贝数的环节。贝瑞及其合作者提出的环化单分子重测序技术cSMART[15]预期可消除这一环节引起的偏差,有助于在相对低的测序通量下获得稳定的真实信号。其实任何NGS技术的研发和应用,实验和计算都是紧密相关的。因此,不同的NIPT厂商必须要根据其NGS平台进行技术上的优化,这既可以是计算上的也可以是实验上的。