二代测序在法医遗传学中的靶向应用:STR、SNP与线粒体基因组的并行分析

摘要

二代测序技术使法医遗传学实现了从单一STR到多标记并行分析的跃升。本文梳理NGS靶向测序在STR分型、SNP分析和线粒体全基因组测序中的应用及其对微量降解检材的特殊价值。

从毛细管电泳到NGS:不只是多了几个位点

毛细管电泳(CE)自1990年代起一直是法医STR分型的金标准平台。CE通过荧光标记引物扩增STR位点并用激光诱导荧光检测扩增产物长度来分型。这一技术框架在20多年里几乎没有发生过底层变化,全球法医DNA数据库(CODIS、NDNAD等)均建立在CE-STR数据之上。

二代测序在法医遗传学中的靶向应用:STR、SNP与线粒体基因组的并行分析

二代测序(NGS)带来的变革不是更多的STR位点这样一个量的提升,而是质的跃迁——首次在单个反应中同时获得STR长度多态性和序列多态性信息。传统CE只能告诉两个样本在某个STR位点都是12次重复,NGS能进一步告诉它们虽然长度相等但序列不同(等位基因异构体),从而增加区分力。例如,D12S391位点的等位基因18在CE上为一个峰,但在NGS上可被解析为5个不同的序列亚型,个体识别力因此显著提升。对于混合样本,序列多态性可以帮助区分两个相同长度但不同序列的等位基因,减少因等位基因共享而导致的包含概率虚高。

三个目标并行:STR、SNP与线粒体

常染色体STR:个体识别核心

法医NGS面板(如Illumina ForenSeq和Thermo Precision ID)在一个反应中同时靶向扩增三类遗传标记。常染色体STR仍是核心——27-32个常染色体STR位点提供个体识别和亲子鉴定的基本分辨力。NGS优势在于这些STR位点同时获得长度和序列信息,对于混合图谱解卷积尤其有价值:两个贡献者共享长度等位基因的概率在序列维度上显著降低。

Y/X-STR与SNP标记

Y-STR和X-STR分别用于父系和母系家系排查以及特殊亲缘关系分析(如缺乏父亲参照时的祖母-孙女关系鉴定)。身份识别SNP(iiSNP)的扩增子长度更短(60-120bp vs STR的100-450bp),对降解检材的耐受性显著优于STR。表型SNP和外显子SNP则提供个体特征推断的新维度——目前已有HirisPlex-S系统可从DNA推断眼睛颜色、头发颜色和肤色,年龄推断标记也在快速开发中。

线粒体全基因组:母系追踪的最后手段

线粒体DNA的拷贝数优势使其成为降解检材的最后手段——每个细胞内数百至数千个线粒体基因组拷贝,而核DNA只有2个。NGS使线粒体全基因组的测序从Sanger测序的分段步进升级为一次反应完成,控制区和高变区的序列信息同时获取,分辨力远超传统HV1/HV2单独测序。

实践中的关键技术挑战

序列等位基因命名标准化

CE时代的等位基因命名基于片段长度,简单且全球统一。NGS时代的等位基因命名需要同时标注长度和序列变异——例如D21S11的等位基因29在CE上为一个值,在NGS上依据重复单元的序列变异可分为多个亚型。目前ISFG推荐的命名标准仍在完善中,不同实验室使用不同版本的参考序列(如GRCh37 vs GRCh38)可能导致比对结果不一致,阻碍跨实验室数据交换和数据库建设。

噪声过滤与混合图谱分析迁移

NGS数据中的stutter产物表现为序列变异而非长度变化,需要专门的生物信息学算法(如STRait Razor、toaSTR)来区分真正的序列等位基因变异和测序/扩增错误。混合图谱分析面临更根本的挑战——大多数混合解卷积软件(STRmix等)是为CE峰高模型设计的,NGS的读数计数(read count)替代了CE的峰高,但二者的噪声分布不同(NGS存在扩增偏向性和位点间读数不均衡),不能直接套用CE时代的概率模型。概率基因分型工具(如EuroForMix和STRmix NGS)正在适配NGS数据的特殊误差结构。

法庭验证与数据库兼容

NGS在法医学中的推广应用面临一个根本矛盾:全球法医DNA数据库均建立在CE-STR数据之上,NGS数据的法庭采纳需要解决与现有数据库的向后兼容问题。目前的主流策略是NGS数据通过去除序列信息后降级为长度等位基因与CE数据库比对——这保留了数据库兼容性但丢失了NGS的序列信息优势。未来需要建立NGS原生数据库,但这一过渡期可能持续十年以上。SWGDAM和ENFSI已发布NGS法医验证指南,要求在分析有效性、开发性验证和内部验证三个层次完成完整的参数评估,包括重复性、灵敏度、混合样本比例检出限、种属特异性、以及已知非文件样本的一致性测试。

参考文献

Borsting C, Morling N. Next generation sequencing and its applications in forensic genetics. Forensic Sci Int Genet. 2015;18:78-89; SWGDAM. Validation Guidelines for DNA Analysis Methods. 2016.