新闻中心
当前位置:首页 > 科学普及

【科普】Y-STR位点分析技术:魔鬼现形记,人类遗传资源与陈年积案

来源: 时间:2022-11-18

近年来,“白银案”、“南医大案”等一系列影响恶劣的陈年积案得以告破。这些案件的共同特点是凶手作案手法凶残、毫无人性,但它们又存在年代久远,直接证据缺失等诸多困难。在最新技术的帮助下,警方的不懈努力终于得到回报。藏在每个人遗传基因中的“特质”,让任何一点蛛丝马迹都无所遁形,科学的光芒最终还是照亮了这世上最黑暗的角落。

作者:生物学博士 谭艳秋

大显神通的Y-STR位点

STR(short tandem repeat,STR)位点是人类基因组内含有的短片段重复序列,是人类基因组的重要组成之一1。在人类基因组计划(Human Genome Project, HGP)开展之前,染色体上的STR区域是一个在研究领域内被忽视的角落。彼时科学家们都把目光集中于人类基因(gene)——这一显而易见具有重要功能的DNA片段。

人类的基因是以DNA片段中的起始密码子(ATG)至终止密码子(TAG、TAA、TGA)为标志性序列(图一),是DNA长链中负责编码成蛋白质的部分。相比之下,STR虽然也位于人类DNA上,也具有明显的碱基结构(如图一中“TCAT”重复结构域1),但它的主要功能并不明确,因而在很长一段时间内并未得到研究人员的重视。

rId7

图一:人染色体上的基因及非基因区域分布情况。其中基因区域包含蛋白编码区、编码区前的AGGA-TATA-GC区及、编码区后的poly(A)区,及基因因进化突变而形成的假基因区和基因片断区。非基因区包括短片段、中度和高度重复序列。

生物信息学分析结果显示,全部人类基因组含有2.91兆碱基对,共有约3.9万个蛋白质编码序列(即基因),平均每个基因大小约为2.7万个碱基,仅占全部基因组的1.5%左右。而相比之下,STR位点则占全基因组的3%左右,遍布于各染色体之间,几乎每隔几个基因就会出现一个STR位点,且几乎所有人基因组的相应位置都存在STR位点。

说白了,STR同样是我们人类基因组中的遗传信息,只不过它蕴含的信息一直没有得到解读。如今,我们仅仅读懂了它的极小一部分,然而,正是这极小的部分,构成了利用Y-STR序列进行命案追踪的核心。

STR位点分析的原理

STR位点存在的生理学意义尚不得而知。它们既不涉及到任何蛋白的合成,也不参与到细胞任何生理学进程。因此,不同人群中重复次数各异的STR位点也不会受到环境压力所筛选(如突变后导致个体对环境的适应能力变差而在进化中被逐渐淘汰等)。在人类繁衍过程中,各种突变版本都得以被完整的保留下来。

有趣的是,在这些不同重复次数的版本中,亲缘关系较近的人群(如父母和子女)STR位点的重复次数比较一致,而亲缘关系较远的人群STR位点的重复次数则存在很大差异。这种有趣的规律很快被科研人员所关注,并首先在确定不同个体的亲缘关系方面加以应用。

近几年,随着测序技术的发现,研究人员仅需获取少量人体DNA样本如血液、毛发或口腔表皮细胞等就可以通过基因测序技术获得某个STR位点的详细序列信息。因此,当人们掌握了某一家族中所有人的STR位点序列信息,就可以根据STR位点的重复次数进行比对、排列,从序列一致性角度重新评价这些人的亲缘关系。以上便是利用STR位点信息确定不同个体亲缘关系的基本原理。

rId8

图二: STR位点的遗传规律。如图,第一代双亲各有两个含有不同重复次数的STR位点STR1及STR2,经遗传逐渐融入了来自于其他家族的STR位点特征,至第二代及第三代获得来自第一代父母双方STR位点的概率为100%,而至第四代获得来自第一代父母双方STR位点的概率则为50%。因此随着亲缘关系渐远,STR位点的一致性会有所降低。

值得注意的是,在图二中,第四代子女仅有50%的概率与第一代双亲具有相同的STR位点,而第五代子女则将有25%的机会与第一代双亲具有相同的染色体。因此仅通过分析这两个STR位点可以获得的亲缘关系信息是十分有限的。甚至在很多如亲子鉴定、个体识别、司法鉴定、交通事故鉴定等重要领域,两个STR位点仅能准确鉴定两代以内的亲缘关系。

所幸,在人类的每一条染色体中均有数个可供鉴定的STR位点,研究人员可以通过增加对各个染色体上STR位点的检测,大大地提高STR鉴定的准确范围。2011年美国国家标准学会专门颁布了一份细胞STR鉴定国家标准(ANSI/ATCC ASN-0002-2011)2。规范并详细记录了15个常用的STR位点在染色体上的分布位置及序列特征(图三)。

rId9

图三: 15个常用的STR位点在人染色体中的位置分布情况3。如图为人22条常染色体及性染色体(X染色体和Y染色体)及其常用STR位点分布。染色体的编号是根据人类细胞遗传学命名的国际体制(ISCN)决定的。

这些STR位点所能提供的序列信息不仅涵盖了亲缘关系较近的人群,还可对某人种、民族、地域中的人群关系进行大致划分,使这些模糊而不准确的主观数据在基因水平上首次得以明确划分。

Y-STR位点分析技术的建立

在STR位点检测技术的发展过程中,研究人员逐渐发现男性独有的Y染色体STR位点分布及遗传特点具有区别于其它常染色体的独特性。在正常的人体细胞内共有23对染色体,其中前22对为常染色体,属于男女共有,而第23对较为特殊,被称作性染色体。性染色体包括一个较长的X染色体及一个较短的Y染色体。女性含有两条相同的X染色体,而男性则含有一条X染色体和一条Y染色体(图三)。

与利用常染色体STR位点的序列相比,母系遗传并不会介入到Y染色体上STR位点的进化中去,使得这些Y-STR位点序列信息得以涵盖亲缘关系更久远、群体更大的男性群体。此外,排除母系遗传的干扰后,利用分析Y染色体上的STR位点也可以大大提高亲缘关系较近的人群STR位点数据的可靠性。

简单来说,罪案寻凶过程中,不管犯罪分子如何狡猾,总会在现场留下若干蛛丝马迹。目前的DNA检测技术已经相当完善而高效,一点点身体组织痕迹就足以让警方采集到可供分析的DNA数据。不过,获取了罪犯的DNA,并不代表找到罪犯。毕竟目前来说收集个人遗传信息涉及到公民的隐私权,很难在大范围内推广。

但有些特殊人群,例如刑事犯罪人员,他们的DNA数据是需要收集并报备的。经过若干年的努力,我国警方已经初步建成了具有一定规模的DNA数据库。通过计算机技术对数据库人员与疑案嫌疑人的DNA进行Y-STR位点比对,警方即便不能确定嫌疑人本身,也很容易找到嫌疑人的父系亲属,即便他们的亲缘关系可能相当远。

只要家族中有一名男性成员和警方DNA数据库中的嫌疑人Y-STR位点比对成功,警方就能确定嫌疑人来自哪个家族,余下的案件侦破工作自然是水到渠成。白银案和南医大案的侦破都是通过这样的方式才得以实现。这就好比钓鱼变成了撒网,警方从茫茫人海中找寻到犯罪分子的概率瞬间增大了数百倍。

除了罪案分析,Y-STR位点分析技术还有哪些应用

2001年,斯坦福大学的皮特·昂德希尔(Peter Underhill)教授利用Y-STR位点分析的方法4,分析了12000个来自中国等东亚地区、大洋洲、西伯利亚、东南亚、中亚的男性个体Y-STR位点序列,并发现他们的Y-STR序列特征可划分为M89、M130和YAP三个突变类型,而这三个突变型都是由M168这一共同祖先繁衍变异得来的,后者与非洲人口的Y-STR序列特征不谋而合,最终从基因的角度验证了人类起源的“走出非洲”假说。

参考资料:

1 Butler J, Gaithersburg. Forensic DNA Typing. Science & Technology 2013; 11 suppl 1:1050-1050.

2 Sittampalam GS, Coussens NP, Brimacombe K et al. Authentication of Human Cell Lines by STR DNA Profiling Analysis -- Assay Guidance Manual: PubMed 2004.

3 Lubbock. Methods for Authentication of Human Cell Cultures and Tissues, Texas Cancer Cell Repository Biorepository Core Laboratory, Cancer Center, Texas Tech University Health Sciences Center School of Medicine, 2017.

4 Ke Y, Su B, Song X et al. African Origin of Modern Humans in East Asia: A Tale of 12,000 Y Chromosomes. Science 2001; 292:1151-1153.

来源:科普中国

版权所有:枣庄市科学技术协会 鲁ICP备05008974号
Copyright 2012 THE MAGISTRATE PEOPLE'S COURT OF SHIZHONG
电话:0632-3321213 传真:0632-3321213 举报中心:skxbgs@zz.shandong.cn