不同SNP检测技术的原理——ARMS、KASP、TaqMan、分子信标及HRM
单核苷酸多态性(Single Nucleotide Polymorphisms,SNP)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,是人类可遗传变异中最常见的一种,占所有已知多态性的90%以上。当SNP发生在基因编码区或基因的调节区域时,它会对基因表达产生巨大的影响,从而影响基因的功能,例如镰状细胞贫血、β地中海贫血等单基因遗传病的发生主要是由于SNP的出现。同时,研究人员发现,SNP可能有助于预测个体对某些药物的反应,为临床基因导向个体化治疗提供理论依据。如CYP2C19参与氯吡格雷、S-美芬妥英、奥美拉唑、伏立康唑、安定、去甲安定等药物的代谢,FDA和CFDA分别于2010和2012年将CYP2C19基因检测的重要性说明纳入氯吡格雷的药物说明书。
SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition嘧啶和嘧啶之间或者嘌呤和嘌呤之间的交换)或颠换(transversion嘧啶和嘌呤之间的交换)所引起,也可由碱基的插入或缺失所致。SNP在CG序列上出现较为频繁,由于CG中C即胞嘧啶常被甲基化,自发脱氨后即变为胸腺嘧啶T,因此大多数情况下,都是发生的C→T的转换,而变成A和G的概率很小,所以一般认为SNP是二等位的,或者是二态性。
图1.基因组上的SNP位点
SNP检测方法众多,大约有20多种,包括基于阵列的杂交、PCR和测序等,本文主要介绍基于PCR技术的部分基因分型方法。
0
1
ARMS-PCR法
ARMS PCR的全称是突变扩增阻滞系统PCR(Amplification Refractory Mutation System PCR),也称为等位基因特异性PCR(Allele-Specific PCR, AS-PCR),是基于Taq DNA聚合酶无法修复引物3’末端的单个碱基错配,从而使得扩增受阻的检测方法。
ARMS PCR将SNP位点设计在上游引物3’末端,结合Taqman探针的方法检测荧光信号值,从而判断野生型和突变型等位基因。换言之,我们应用ARMS PCR对野生型和突变型等位基因进行检测时,需要设计两条3’端核苷酸分别对野生型和突变型特异的上游引物,以及一条通用的下游引物,一条通用的探针。在Taq DNA聚合酶作用下,与模板不能完全匹配的上游引物将不能完全形成互补碱基对,从而产生错配,链延伸反应因3’,5’-磷酸二酯键形成障碍而受阻,不能进行延伸,而与模板完全匹配的引物体系则可以持续延伸,由于Taq酶5’到3’外切酶活性,可将Taqman探针上的荧光基团水解,导致探针上荧光基团与淬灭基团的距离增大,从而使得荧光信号被仪器检测到,最终计算出对应的△Ct值。
图2.ARMS-PCR检测原理
在ARMS-PCR基础上也发展出了一些改良方法,如四引物扩增阻滞突变系统PCR(tetra-primer amplification refractory mutation system PCR,Tetra-primer ARMS-PCR)。该方法需要设计四条引物,其中两条为3’末端位于SNP位点上的内引物,这两条引物方向相反,且分属于不同基因型;另外两条为通用外引物,且两条引物与SNP位点的距离应不一样。将四种不同的引物添加到预混液中,第一对引物旨在扩增包含感兴趣的SNP(红色)的DNA序列,另外两个引物对野生型(Wt)等位基因(黄色)的正向链和突变型等位基因(橙色)的反向链具有序列特异性。
图3.四引物扩增阻滞突变系统PCR检测原理
通过琼脂糖凝胶电泳检测,如果样本是纯合的,则会扩增出两个长度的PCR产物:一个长序列(红色)和一个短序列(如果是野生型则为黄色,如果是突变型则为橙色);如果样本是杂合的,将扩增出上述三种长度的 PCR 产物。
由于凝胶电泳检测时间较长,而且开盖进行产物分析易造成污染,因此市面上使用ARMS-PCR方法开发的产品,大部分采用了闭管检测的实时荧光PCR法。该方法理论上单个碱基的错配即可阻碍PCR的扩增,但在实际检测时,单个碱基的错配依然可以延伸扩增,只是效率较低。为了提高其特异性,有时需在3’端倒数第2位或第3位碱基处引入一个错配碱基,该错配碱基与3’末端的错配碱基共同作用,以降低非靶标序列的扩增效率。此外,一个位点只需要一条TaqMan探针,探针序列固定,优化上游引物即可,整体试剂开发成本较低、周期较短;结果判读方面来看,只需要看Ct差值或者Ct值有无即可,高效便捷。但该方法也存在一个样本需要分两管进行扩增检测、引物设计难度较大等问题。
0
2
KASP法
KASP是指竞争性等位基因特异性PCR(Kompetitive Allele Specific PCR),是一种基于PCR扩增后荧光检测的基因分型技术,最初由英国的KBioscience公司所开发,目前KBiosciences公司已被英国政府化学家实验室(LGC)收购。该方法是基于引物末端碱基的特异性匹配对SNP进行检测的方法,其技术原理如下:
第一步 引物探针设计
首先,针对SNP的等位基因设计两条对应的上游引物,引物3’末端分别位于各自的SNP位点上,同时引物5’端各自带有一段独特的标签序列,而下游引物则是一条常规设计共用的引物。引物一共是三条,两条带有标签序列的分型上游及一条通用下游。其次,设计两条与上游引物标签序列一致的荧光探针,探针的5’端分别标记不同的荧光基团,同时对应于荧光探针设计各自互补配对的淬灭探针,并在淬灭探针的3’端标记淬灭基团,探针一共是四条,两条荧光探针和两条淬灭探针。
第二步 普通PCR扩增
在第1轮PCR扩增中,等位基因特异引物(3'末端能配对的)就可识别特定等位基因模板,完成等位基因识别,反向通用引物也会结合并完成整个PCR过程,在此阶段,荧光探针仍与其互补的淬灭探针结合,不会产生荧光信号。从第2轮PCR扩增开始,产物中出现含有通用标签序列(tag sequence)的模板,这步之后即可把通用标签序列引入与SNP对应的PCR产物中。随后荧光探针与tag互补的DNA链结合而添加到PCR产物中,因此不再与其互补的淬灭探针结合,从而产生荧光信号而被检测到。
第三步 荧光检测和分析
利用荧光信号检测仪或荧光定量PCR仪(配有相应荧光探针的检测通道)进行信号读取,并用软件采集信号判别等位基因类型(如果进行聚类分析,要用到KlusterCaller或SNPviewer软件)。
图4.KASP法检测原理
KASP法在整个过程中采用降落PCR的程序,从而保证探针和引物按照预期进行结合,当退火温度高时,引物因为Tm值高,会先与模板进行特异性的结合,然后在Taq酶作用下进行扩增,使得探针扩增的原始模板得到富集,随着退火温度降低,探针开始结合模板,然后产生荧光信号,最终在低于40度情况下通过读取终点的荧光信号来进行SNP分型,保证了该方法很高的分型准确性。另外,该方法针对上游引物标签序列合成通用探针,可以与各种不同的基因特异引物配合使用,而不需要针对每个特定的位点进行探针合成,这极大降低了实验的试剂成本。其次,KASP在实验操作上满足低、中、高通量基因分型的要求,相比于其他技术,具有一定的灵活性,更容易实现高通量和自动化检测。该技术目前已在农作物分子标记辅助育种、种质资源鉴定、遗传图谱构建和种子纯度鉴定等领域得到了广泛的应用。
0
3
TaqMan探针法
TaqMan探针是一种双标记、自淬灭的水解探针,在PCR反应中加入两条两端带有不同荧光标记的特异探针来识别不同的等位基因。其5’和3’末端分别标记荧光基团和淬灭基团,在探针结构完整时两者距离较近,荧光基团的信号可被淬灭。而在PCR扩增过程中,若TaqMan探针与靶标序列完全匹配,探针则可结合在DNA模板上,此时Taq酶延伸至探针位置时,其外切酶活性将切割水解探针,释放荧光基团,使得荧光信号增强。而且,随着扩增产物的增多,荧光信号越来越强,从而可通过仪器实时监测荧光信号的变化过程。
由于MGB探针的长度可以设计得更短(短至13个碱基),有利于提高探针的识别特异性,因此用于检测SNP的TaqMan探针常用MGB修饰,在TaqMan探针的3’端结合小沟结合物(minor groove binder,MGB),MGB与DNA螺旋的小沟(minor groove)契合,通过稳定DNA双螺旋结构来提高杂交的准确性和稳定性。另外MGB探针包括一个不发光的淬灭基团(NFQ),能够真正消除传统淬灭基团产生的背景荧光信号,提高信噪比,提高检测灵敏度。
图5 TaqMan探针法检测原理
TaqMan探针法相对而言,方法成熟、操作便捷,体系/平台相对开放,临床端认可度高,在注册文件审核等方面更有优势,是最常见的SNP分型方法之一;但是其也有不可忽视的限制性,如每个位点需要两条探针,探针价格昂贵,因此TaqMan探针法通常用于少量SNP位点大量样本的分析,且对于近距离SNP位点探针设计也是比较困难的。
0
4
分子信标法
分子信标是一段双标记的寡核苷酸探针,其5’末端和3’末端分别标记荧光基团和淬灭基团,且探针5’端和3’端的部分碱基可互补配对,从而形成茎环结构,使得荧光基团和淬灭基团相互靠近而荧光信号较低。分子信标的环状结构部分包含SNP检测位点,当模板与分子信标环状结构的核酸序列完全匹配时,分子信标可与模板杂交形成伸展状态,从而导致荧光基团和淬灭基团的空间距离拉大,荧光信号增强,因此可被仪器检测,并确定SNP位点。使用不同荧光基团标记的分子信标,则可区分SNP类型。
图6.分子信标法检测原理
分子信标法与TaqMan探针法类似,均是通过探针中单个碱基的识别能力区分SNP,只是分子信标采用茎环结构,而TaqMan探针使用MGB修饰,以提高探针对SNP的识别特异性。该方法本底低,特异性高,灵敏性高,不必与未反应的探针分离即可检测,可用于活体分析;但是探针合成时标记较复杂,设计难度大。在进行分子信标的研究和应用时,茎干区和环状区的序列设计是关键所在,这种设计不仅决定了其构象,使在杂交后淬灭基团与荧光基团之间的距离达到足够大,而且决定了其合适的使用温度。其次,环境pH值、纯度也是影响分子信标的重要因素,pH值过高,分子信标的发卡结构可能被破坏,出现假阳性结果。
0
5
高分辨率熔解曲线(HRM)
PCR扩增的熔解曲线取决于其扩增序列,序列中一个碱基的突变都可以导致双链DNA的解链温度发生变化,通过实时荧光定量PCR仪监测这种细微的温度变化,可以知道扩增的序列中是否有突变发生,从而对其进行基因分型。
高分辨率熔解曲线(high-resolution melting analysis, HRM)是通过特定染料与扩增特定的DNA区域,在高分辨率熔解条件下对扩增产物进行温度升降,通过熔解曲线的变化区分不同的基因型或等位基因。HRM检测通常使用饱和荧光染料(如:LC Green、LC Green Plus、SYTO 9等),具有更强的DNA结合能力,且不影响PCR扩增,在DNA解链过程中也不会发生重排,使得熔解曲线具有更高的分辨率。
核酸片段的固有特性,如DNA序列的长度、GC含量和碱基互补性差异等,均能影响高分辨率熔解曲线,而结合高精度荧光定量PCR仪,其分辨精度则可达到对单个碱基差异的区分,从而可用于确定SNP位点。
图7.高分辨率熔解曲线法检测SNP结果示意图
该方法引物设计简单,且单碱基改变、插入、缺失都能通过HRM来检测,实验操作简单,不需要探针,成本相对较低,并且可以发现未知突变(但不能知道具体的突变类型)。但是HRM技术对实验仪器的温度分辨率要求相当高,需要达到0.02~0.1℃,每升高1℃采集荧光25次,以满足对单碱基差异的区分。对温度均一性同样要求较高,Tm的标准偏差为0.020-0.264℃(孔间温度均一性要达到0.264℃以内才能保证HRM分析结果的准确性),一般PCR两孔间温差在0.3~0.5℃,这就导致两孔间最终熔解温度相差较大,无法保证HRM分析结果的准确性。
SNP分型原料分享
翌圣生物作为上游原料企业,在分子酶领域深耕多年,目前已开发了ARMS-PCR法及TaqMan探针法的SNP分型检测通用原料,已被下游厂家应用于肿瘤伴随诊断、药物基因组学、单基因遗传病、疾病易感性研究等多个领域。
通过上面SNP科普般的分享,相信大家对部分主流SNP检测方法及特点有了基本的了解,那SNP主要在哪些应用领域起作用,以及常见的SNP问题有哪些,限于篇幅原因,敬请期待下篇SNP干货分享哦!