医博园 医博园
智慧医学网 | 网上书店 | 考试培训 | 搜索 | 论坛规则 | 注册
登录 | 帖子收藏 | 帮助

» 医博园 » 分子生物学和生物化学技术版 » 专题与进展  

按打印兼容模式打印这个话题 打印话题    把这个话题寄给朋友 寄给朋友   
post new topicreply to topic
flat modethreaded modego to previous topicgo to next topic
【原创】SNP概述
jacklinus


不争,天下莫能与之争
医博园版主

发贴: 16
积分: 4
得票: 0
状态: 离线
2008-07-14 20:41会员属性给该会员发送悄悄话回复该帖子搜索该用户发表的帖子复制帖子内容收藏该帖子
SNP概述

人类基因组计划实施十多年来,取得了显著的成果。在包括中国在内的20个研究课题组的共同努力下,人类基因组的DNA序列已被初步地测定和分析。现有的研究结果表明,人类基因组约含有3万~4万个蛋白质编码基因。作为一个十分稳定却又存在各种变异的体系,全面深入地了解个体和群体间基因组的变异或多态性正日益显示其重要性,这不仅因为更多的多态性有助于基因的鉴别和定位,同时通过建立序列变异与表型、序列变异与疾病(如各种心血管病及癌症)风险之间的关系,可以对人类进化、种群多样性及复杂疾病的诊断和治疗产生巨大的促进作用。
人类DNA序列变异约90%表现为单个核苷酸的多态性。1994年,单核苷酸多态性(Single Nucleotide Polymorphism,简称SNP)这个术语第一次出现在人类分子遗传杂志上,随后Lander 第一次正式提出SNPs为新一代分子标记。SNP广泛地存在于基因组中, 据国际SNP图谱研究组(The International SNP Map Working Group)报道,截止2001年2月,人类基因组已包含约142万个SNP。而按人类基因组中每400~1000个核苷酸出现一个SNP估计,整个人类基因组至少有300万个SNPs。随着DNA序列测定研究工作的纵深发展,人们愈来愈相信基因组中这类多态性有助于解释个体的表型差异、不同群体对疾病特别是复杂疾病的易感性以及对各种药物的耐受性和对环境因子的反应,因此寻找SNP已经成为人类基因组计划的重要内容。本文拟在对人类基因组SNP的概念和特性作简要介绍的基础上,着重讨论SNP的应用和检测技术。
一、 人类基因组的单核苷酸多态性  
SNP是指在基因组水平上由于单个核苷酸的变异而产生的一种DNA序列多态性。这种单核苷酸变异包括单碱基的转换、颠换、插入和缺失。严格来讲,SNP要求变异在人群中出现的频率不小于1%,因此单碱基的插入和缺失并不是真正意义上的SNP。遗传密码有四种碱基组成,但通常SNP只是一种二等位基因(biallelic)或二态的遗传变异,在该位置只存在两种不同的碱基,三等位或四等位基因的SNP很少见,因此,SNP也被简单地称为双等位基因标记[1]。单个碱基的变异可能是转换(A/G,C/T),也可能是颠换(C/G,A/T),如果四种碱基随机突变,SNP中的颠换应该是转换的2倍,但实际上四种碱基的突变机会并不均等。研究表明,发生在同型碱基之间的转换占单碱基变异的70.1%,而发生在嘌呤与嘧啶之间的颠换约为29.1%[2-5]。SNP在CG序列上出现最为频繁,且多是发生C/T转换,原因是C/G中的C即胞嘧啶是甲基化的,它能自发地脱氨基而替换为胸腺嘧啶[6]。
SNP在基因组内可以被人为地划分为两种形式:一是主要分布在基因编码区(coding region)的功能性突变,又被称为cSNP;二是处于非编码区的大量单碱基变异。由于选择压力的原因,SNP在单个基因或整个基因组中的分布是不均匀的,SNP的数目在非编码区要远远大于编码区。据Halushka推测,人类基因组100万个SNPs中,大约50万个左右在非编码区,24万~40万个在编码区[7],20%~30%引起蛋白质编码序列改变的非同义编码SNPs(non synonymous SNPs, ns SNPs)会导致蛋白质功能的变化[8-10]。 
大规模SNP的鉴定工作开始于1998年,在此之前已有两代遗传标记,即第一代遗传标记限制性片段长度多态性(restriction fragment ength polymorphism, RFLP)和第二代遗传标记微卫星多态性(microsatellite polymorphism)。RFLP是20世纪70年代后期建立起来的标记系统,是指限制性内切酶特异性切割DNA链,由于DNA上一个“点”变异造成的能切与不能切的两种情况,从而产生不同长度的片段(多态性)。RFLP也被认为是SNP的前身。微卫星多态性主要表现在2~6个核苷酸的串联重复,其位点在人类基因组中分布较广,且符合孟德尔遗传规律,是很好的遗传标记。另一类更加普遍的多态性是基因组中的单个碱基的变异,即广义上的SNP。SNP作为第三代遗传标记,只有两种等位型,变异程度不如微卫星,但由于它在基因组中数量巨大,分布频密,具有较微卫星更稳定的遗传特性; SNP的二态性也使得其在筛选过程中,只需要通过简单的+/-分析来决定基因分型,不用像其他遗传标记那样需要分析片段的长度,更容易实现分析的自动化。
目前,SNP研究是人类基因组研究的一个热点。1998年Wang[11]等首先报道了根据SNP技术建立的人类基因图谱,获得的SNP平均距离为2cm,这些SNP数据可由公众免费获得。另外,美国、日本及欧洲一些国家等的政府科研机构及部分私人公司研究开发的SNP图谱也将免费向公众提供。近年来,储存在公共数据库里的SNP数量正在以几何级数迅速增长。到1999年4月,总共才分析了7000个SNPs,其中cSNPs占半数;而到了当年12月16日,仅美国国立生物技术信息中心(NCBI,http://www.nchi.nlm.nin.gov/SNP)的SNP数据库就已收录了21172条SNPs;至2001年8月,该数据库已经取得了2996773个SNPs数据,其中非冗余的SNPs共165万个[12];德国的HGBAS网站(http://hgbas.cgr.ki.sei)到2001年7月也已收录了531850个SNPs数据[13]。另外,日本建立了JST(http://SNP.ims.u tolkyo.ac.jp)SNP数据库;中国也于2001年底启动了“863”计划,进行中华民族基因组SNP系统目录的构建与研究。
二、SNP的应用
1 SNP与遗传图谱作图  
遗传图采用连锁分析方法绘制而成,主要应用于基因在染色体上相对位置的确定。尤其是通过家系调查和致病基因的连锁分析,对可疑疾病易感基因进行定位,从而为今后致病基因的克隆奠定基础。今天的遗传标记的应用可以说已经深入到医学与分子生物学的各个领域。
有两种不同而又互补的方法可以进行全基因组的关联分析。一种是直接检测候选基因编码区中所有常见的功能性变异;另一种是使用分布在编码区和非编码区的高密度SNP标记分析易感人群和对照,根据连锁不平衡分析特定的SNP与表型的关联。无论是致病变异还是群体进化的研究,建立高密度SNP遗传图都是必需的。 
SNP与RFLP和STR等DNA标记的主要不同,是不再以“长度”的差异作为检测手段,而直接以序列的差异作为标记。技术上,它可以完全摆脱电泳分型的瓶颈,而采用最新的非电泳分型技术,如变性高效液相色谱分析、飞行质谱分析、定量PCR仪分析以及高通量的芯片分析技术等。虽然SNP单个基因座的多态性很差(只有二态),但SNP在整个基因组中极为丰富,并且有可能使得遗传图上的遗传标记在密度上达到“极限”。如1998年5月的Science杂志发表的第一张人类SNP遗传连锁图谱,也可称为人类第三代遗传图谱,包括了2227个位点,平均密度达到2cM。
目前,建立SNP标记通常需要5个步骤:(1)获取DNA序列;(2)根据DNA序列确定序列标识位点;(3)扫描序列标识位点以寻找SNP;(4)确定SNP;(5)将SNP定位到染色体上[14]。目前关于基因组的公共数据库已有丰富的表达序列标识(EST)和序列标识位点(STS),利用这些含有重叠区的序列,已有实验室成功建立了发展SNP标记的改良方法。Wang等通过比较筛选公共数据库(Genebank)中的EST,制作了第一张人类SNP遗传图,鉴定了3241个SNPs,并将其中2227个定位。Taillon Miller等通过扫描已用于作图的STS来获取SNP,而使SNP标记的建立简化为两步(扫描STS和确定SNP),还利用大片段测序中的BACs和PACs重叠克隆测序技术,鉴定了5,7和13号染色体上的153个SNPs,并分析了它们在不同群体中的遗传特性。
2 SNP与疾病相关基因定位
SNP被认为是一种稳定遗传的早期突变,它们之间存在着连锁不平衡,与疾病有着稳定的相关性。因此,研究者期望应用高密度的SNP图谱,用相关分析的方法来定位一系列多基因疾病,如糖尿病、高血压、哮喘癌症等的主基因。此外,存在于编码区及紧邻上下游序列中的SNP,可以改变基因的表达水平和表达产物的功能。这类SNP直接关系到人类对疾病的易感性,对环境因子及药物的反应。Knight[15]等通过TNF启动子区域的DNA足迹,鉴定了一个SNP,它使转录因子OCT 1结合到DNA蛋白质复合体的一个新的位点,改变了人单核细胞的基因表达,具有此SNP的个体对严重疟疾的易感性比普通人增加4倍。
利用SNP来定位复杂的疾病基因已引起人们的极大兴趣,各国研究者正致力于人类基因组中SNP的鉴别与作图,然而到目前为止,可用于疾病基因定位的SNP还很少。Martin[16]等已开始为早老性痴呆症(Alzheimer diseaseAD)的候选基因ApoE附近的SNP制图,在ApoE周围1.5Mb的区域内为60个SNP分型,并通过家系连锁分析,在ApoE基因两侧各40kb的区域内13个SNP中发现有7个连锁,已有有力证据表明这7个SNP以及ApoE基因周围16kb内另外两个SNP与AD连锁。Martin等的研究表明:可通过检测复杂疾病候选基因附近的SNP及连锁分析定位疾病基因,并可由SNP的分型来预测疾病易感性。因此,高密度的SNP图谱将为疾病基因的定位及疾病的易感性研究打下基础。
3 SNP与药物基因组
药物基因组学是基于药物反应的遗传多态性提出来的,所以遗传多态性是药物基因组学的基础,而SNP则是遗传多态性的重要组成部分。药物的遗传多态性可以表现为药物代谢酶的多态性,药物转运体、药物受体的多态性。这些多态性的存在都可能导致许多药物治疗中药效和毒副作用的个体间差异。药物基因组学正是从基因水平揭示这些差异的遗传特征,在分子水平上对病症进行全面缜密的调查,包括选择人体中有关药物作用、活性及消除的候选基因,以及鉴别基因序列中的差异。这些差异既可在生化水平上研究以评价它在药物作用中的功能意义,也可在群体水平上研究以确定它在药物作用中与所观察到的表型差异的统计学联系[17]。所以,药物基因组学在加快药物遗传学及药物开发的同时,用更加科学的手段给病人开药,即依据病人的基因组特征优化治疗方案。
Paulussen[18]等首先利用探针药咪达唑仑确定CYP3A5的表型特征,然后利用PCR为基础的检测方法分析了CYP3A5基因的5′侧翼区,鉴定了两个连锁的多态位点:T 369G、A 45G,从而把表型与基因型联系起来。这两个多态位点位于转录调控区,与基因的表达和活性的提高有关。CYP3A4、CYP3A5的表达及活性具有明显的个体差异,从而影响了对药物的反应及疾病易感性,因此,对CYP3A基因内部SNP的鉴定,将对研究与其相关的药物反应及疾病易感性具有重要的意义。Bond[19]等在113名***成瘾患者及39名无毒品或酒精依赖性的正常人中进行了DNA测序,在mu受体基因编码区鉴定了5个SNP,其中A118G导致了N 糖基化位点一个氨基酸的改变,这种变异虽未改变受体对所测试的阿片肽及生物碱的亲和力,但它结合β 内啡肽的能力是通常等位基因的3倍,而且含有A118G等位基因的mu受体结合β 内啡肽后被激动剂诱导激活的能力也是通常等位基因的3倍,这表明mu阿片受体基因中的SNP改变了受体结合及信号传导的能力。对此SNP的检测为研究成瘾性疾病的易感性及针对性治疗打下了基础。随着对基因组研究的不断深入,将能发现数千乃至数万种基因的功能,对数万乃至数十万种基因的多态现象进行系统研究,也将成为现实。这样,人们将能够在DNA水平上解释为什么同一类病人对同一种药物有不同的反应。医生将根据不同个体开处方,即所谓“个性化治疗”。“个性化治疗”的关键,是对基因多态现象的研究,而SNP则是不可缺少的重要信息。
4 SNP与新药开发  
基因的多态性常常被用作寻找疾病相关基因的靶位。由于SNP广泛存在于基因组中,且判断结果容易编成由0和1组成的数字信号,可实现简捷、高速、大量的分析。许多遗传病都具有杂合子的特征,这迫使我们根据不同的突变设计治疗方案。我们可以根据基因内部的突变来设计等位基因特异性的治疗药物。Gabriele[20]等发现了一种锤头状的核酶Rzpollal,能特异性地识别人COL1A1基因mRNA中的一个SNP,具有此SNP的等位基因杂合子与骨生成缺陷(osteogenesis imperfecta OI)有关。体外切割实验表明:核酶Rzpollal对mRNA的切割活性高,特异性强,为OI的基因治疗奠定了基础。这种核酶如果能对1/5的OI病人产生疗效,则可称为一种有效的药物,因为迄今为止,已在OI基因内部发现了150多个的不同的突变[21]。更多地了解基因内部的SNP,有助于设计特异性更强的基因治疗药物,抑制含有SNP的突变等位基因的表达,治疗杂合子突变疾病。
5 SNP与连锁不平衡以及群体遗传学和进化遗传学研究
群体遗传学研究某一群体的遗传组成以及不同群体遗传组成之间的关系,其使用的主要指标是DNA多态。随着SNP时代的到来,可以使用SNP来进行群体遗传学研究。按照连锁不平衡的原理,在很久以前可能发生过一个单核苷酸改变的事件,创造了一种新的等位型,这种新的等位型位点附近可能还有其他多态位点,这时就有可能建立一种新的单倍型。如果这种新的单倍型在几个世纪后依然未变,我们就可以说新位点与其附近的多态之间建立了一种稳定的连锁不平衡。据此,我们可以根据一种DNA多态来推测与其连锁不平衡的等位型,或以一种多态标记作为某一特定等位型(如致病基因)的代表。
SNP已成功地用于人类进化研究。生物界的进化及生物多样性的形成与基因组的突变及自然选择密切相关。构建SNP图谱,通过SNP研究人种的起源和人类的迁徙历史是很有用处的。Kumar等计算人与猩猩以及不同人群间的差异,得出人与黑猩猩约在500万年前趋异的结论。也有人研究人类线粒体DNA的SNP图谱,提出了现代人起源于非洲,并于10-20万年前“走出非洲”,在其所到之处取代了当地的直立人的假说[22]。
6 SNP与法医学 
SNP作为最多的一类遗传标记可以用于基因分型,从而在个人识别、亲权鉴定中发挥作用。已有作者采用寡核苷酸连接分析(PCR-OLA)测定含有20个常见SNP的PCR扩增片段作基因分型。这种分型可以采用比色分光光度方法,并自动化地完成,因而能在较大群体中进行[23]。
三、SNP的检测方法
理论上说,任何用于检测单个碱基突变或多态的技术都可以用于SNP的识别和检出,以下从所用技术不同简要介绍一些已有的检测方法。
1 以荧光共振能量传递(FRET)为基础的检测方法 
荧光共振能量传递(fluorescence resonanceen-energy transfer,FRET)作用是指一对染料,称为供者-受者(donor-acceptor)染料对或称引爆者-淬灭者(reporter-quencher)染料对之间的作用。当这两种染料相互靠近时可以通过FRET作用使供者不发荧光,而二者分离时供者发荧光,荧光量可用荧光计检测。只有荧光物质的发射光谱与淬灭物质(quencher)的吸收光谱重叠时FRET才会发生。
1.1 Taqman法如图1所示。

该方法原理是在PCR反应中,将供者-受者染料对分别结合到Taqman探针的两端。探针未与目标序列结合时,通过FRET作用使供者不发荧光;完全互补配对后,由于TaqmanDNA聚合酶具有5′核酸酶活性,可将供者从探针上切下来,其发出的荧光可用荧光计检测。如果探针与目标序列中存在错配碱基,就会减少探针与目标序列结合的紧密程度及TaqmanDNA聚合酶切割供者的活性,也就影响了供者的荧光释放量,从而使碱基突变链与正常链得以区分。Holloway[24]等人于1999年用此法识别出IL-4基因启动子区距离翻译起始点的第589碱基位存在C→T的转换。Taqman法优点在于该反应在PCR过程中进行,不需要分离或洗脱过程,从而提高了实验速度并减少了PCR污染的可能性。
1.2 分子灯塔(molecularbeacons)法
由Tyagi等人[25]于1998年建立,在PCR的退火过程中进行(如图2)。
  分子灯塔是合成一个U型的单链寡核苷酸探针(由于探针序列内部可有一定程度的互补配对),在探针两端也加上供者-受者染料对。U型探针使两染料靠近,通过FRET作用使供者不发荧光。当探针与目标序列完全互补配对后,两染料分离,使得供者的荧光量增至900倍左右。如果目标序列中存在错配碱基,就会影响探针与其结合从而影响到供者的荧光量,使碱基突变链与正常链得以区分。DABCYL(4-[4′-二甲基胺基苯基氮]安息香酸)可淬灭很多荧光物质发出的荧光,可作为一种常用的淬灭物质。Tyagi构建了4种分子U型探针,其核苷酸序列除中央位点处分别为T、C、A、G外完全相同,探针的5′端分别用四种荧光物质标记:香豆素(coumarin,发蓝光)-T,荧光素(fluorescein,发绿光)-C,4甲基蕊香红(tetramethylrhodamine,发桔红色光)-A,德州红(Texasred,发红光)-G,探针的3′端均结合DABCYL,将这4种探针分别与四种模板链(中央位点处分别为A、G、T、C)互补配对结合。实验证明:未结合时探针均不发荧光(通过FRET作用),只有探针与模板链完全互补配对时构象才会由U型变为直线型,从而发出大量荧光,即便只存在一个碱基的错配也不会发出荧光。可以通过荧光的颜色不同,识别出该位点的碱基种类。这种U型探针与直线型探针相比,大大提高了特异性,如果连接能发出不同荧光的染料对的数个分子灯塔,可以在同一反应体系中同时检测多个目标序列,大大提高了实验效率。此法敏感性很高,即便是单个碱基的变化亦可影响到荧光量的多少[25]。
2 以分子杂交技术为基础的检测方法
2.1 寡核苷酸连接分析(oligo nucleotide ligation assay,OLA)  
于1994年由Samiotaki[26]等人建立,其原理是将PCR产物变性为单链,然后加入两条探针A和B(约20个核苷酸长),A和B的序列分别与目标DNA中SNP位点两旁的序列互补配对,A的5′端与B的3′端紧邻。如果两条紧邻的探针与目标DNA单链完全互补配对结合时,DNA连接酶即可将两个探针的5′端磷酸基和3′羟基形成磷酸二酯键而连接起来。如果A探针的3′端存在错配碱基的话,则连接反应不发生。连接产物变性后,可以作为引物的模板,重复上述变性-复性-连接反应10个循环后,根据特殊分光光度计测得反应体系的吸光度,来判断是否发生连接反应。是否发生连接反应成为模板DNA单链是否存在碱基变化的依据(图3)。如果染色体上等位基因的平均分布频率不同,要达到同一分辨率,则需不同数量的探针[26]。OLA法的优点是仅需使用1/10常用量的DNA样品,所评价的是DNA内部序列,且检测结果不受PCR扩增反应中非特异性产物的影响。此外,结果可直接传入计算机储存和统计分析,自动化检测,大大提高了检测效率。缺点是必须已知SNP位点所在,才能有针对性地合成探针,而且存在多个SNP位点时,需要合成多个探针进行检测[27]。

2.2 等位基因特异性寡核苷酸探针杂交法(allele-specific oligo nucleotide hybridization,ASO)  
该方法采用正常与变异序列的两个寡核苷酸探针,通过严格控制杂交条件(如温度、离子强度、pH值等),正常序列只能够与正常人DNA杂交,而不与变异DNA杂交,而变异探针则相反[28]。如果与两个探针均能杂交,则表明被检测个体是同时具有正常序列和变异序列的杂合子。ASO法具有很高的特异性和敏感性,可用于有基因变异的遗传病的基因诊断和筛选,在有固定点突变的筛选中具有重要价值,如对p53基因、人乳腺癌基因1和2突变热点的筛选。但必须已知待检基因的缺陷,才能针对性合成变异的寡核苷酸探针,且杂交条件须严格控制,操作复杂,费用高及同位素污染等,故有逐渐被取代的趋势。
2.3 动态等位基因特异性杂交(dynamic allele specific hybridization,DASH)法  1999年由Mathias等人建立[29]。原理是单链探针事先连接染料,探针与目标序列互补配对后形成双链,染料可发出荧光。然后将反应体系加热,测定随温度的上升荧光量的改变。荧光量迅速减弱时的温度就是双链的解链温度或变性温度。两条链若不存在错配碱基,其对热变性的抵抗力强,即两条链不易分离,其解链温度高;如果双链中存在一个错配碱基,其解链温度就低,使正常链与变异链得以区分。研究发现用于DASH法的探针最佳长度为15~21个核苷酸,且SNP位点设计于该探针的中央处,对SNP的检出率高。作者摸索出最佳的反应条件为:由0.1mol/LHepes,50mmol/LNaCl,1mmol/LEDTA组成缓冲液;pH8.0;1∶10000稀释的SyberGreenI染料,在此条件下反应,可使探针与目标序列的反应温度提高到60~70℃,比正常杂交反应的温度高出20℃;而且使正常双链与错配双链的解链温度差异达到6~12℃,使二者易于区分。此外,DASH法在相同的反应条件下,能成功识别出任意两种碱基的互变。且研究者可以通过检测荧光消失时的温度来辨析突变部位的碱基的种类。
2.4 DNA芯片(DNA chip)法
DNA芯片法是在小硅片上进行微阵列分析,让目标DNA与密集的多重寡核苷酸探针阵列进行杂交,严格控制杂交与洗脱条件,杂交信号的有无、强弱以及荧光或化学光扫描,用电脑进行分析以检出SNP。其关键在于芯片上高密度地原位合成大量不同的寡核苷酸探针以及实现杂交后的荧光测定和计算机分析,使SNP的检测或识别高度自动化,批量化[30,31]。DNA芯片法有望在片刻之间评价整个人类基因组。在1998年召开的关于SNP的第一届国际会议中,已生产出同时可检查10000个基因位点的芯片[32],并希望开发出可以一次评价人类全基因组的芯片。近年来在晶体上以“光刻法”直接合成高密度的可控序列寡核苷酸技术的突破,使DNA芯片法显示出强大的威力,并在建立SNP图,表达图及大规模突变检测等方面投入实际应用。
3 PCR技术与其他方法结合的检测方法
3.1 变性-高压液相色谱法(denaturing-high-performance liquid chromatography,DHPLC)  
该方法是1996年由Jin等人建立的。高压液相色谱仪的核心部分是DNA分离柱,柱结合的化合物使其带正电荷,而DNA分子带负电荷,越小分子的DNA越先被洗脱。DHPLC法的原理是DNA经PCR扩增后,由于错配碱基与正常碱基不能配对,形成异源双链[33]。正常配对DNA片段和异源双链DNA片段在进行HPLC时,异源双链能配对的部分就形成一个小泡,即发生部分解链。由于单链DNA所带负电荷比双链少,所以异源双链先被洗脱出来,从而与正常配对双链得以区分。DHPLC用于检测SNPs的关键在于解链温度选择(mobile phase temperature,MPT),过高的温度会导致变异双链的漏检。此外作者还证实即便是标本中变异双链的量少至10%到20%,也可检出。这种方法的最大优点在于自动化分析,每个样品只需要5min左右,可以程序化、大规模化、快速,分辨率高达1bp∶1~1.5kb,因此有广泛的应用前景。
3.2 单链构象多态性(single strand conformational polymorphism, SSCP) 
单链DNA的折叠结构是由单核苷酸序列决定的,当某一个碱基发生突变时,便会直接影响该链的构象,从而引起其电泳行为的差异。该方法是将PCR产物先在95℃下变性解链,再在冰中骤冷,然后通过非变性凝胶电泳分离。SSCP方法操作简单、经济,适用面广。一般来说,对于150~450bp的片段,SSCP的检出率可高达90%,但它的影响因素较多,如电泳温度、凝胶浓度等均可影响灵敏度[34]。
3.3 变性梯度凝胶电泳(denaturing gradient gel electrophoresis, DGGE)  
异源DNA双链与同源DNA双链由于熔解温度Tm值不同,从而在分子稳定性或单链构象上也不会完全相同,DGGE正是根据这一特点,利用变性剂的浓度梯度凝胶电泳来进行分离检测。分别具有一种SNP等位基因型的两种DNA分子之间即使只有一个碱基对的差异,也会在不同时间发生部分解链,从而分离成两条带。DGGE的检测片段可以达到1000bp,对100~500bp的片段更为准确,所以已十分广泛地用于SNP的检测。
3.4 限制性片段长度多态性(restriction fragment length polymorphism, RFLP)  
限制性内切酶是一类识别DNA特异位点,并在特异位点进行切割的酶类。该技术的前提是待检测的SNP位点的两侧需含有限制性内切酶识别序列。此法简便、快速,可进行大量样本的分析,缺点是不能直接分析DNA的排列顺序,且有近半数的SNPs并不导致酶切位点的改变。在PCR中引入错配引物可克服这一不足[35]。
3.5 突变错配扩增检验(mismatch amplification mutation assay, MAMA)  
设计两个3’ 末端不同的引物,分别与正常DNA和突变DNA互补。样品检测时,分别加入这两种引物之一与互补端引物同时进行两个平行PCR,通过PCR反应产物可以判断其基因型。如果只有与正常DNA互补的引物扩增出PCR产物,则样品是正常;反之,如果只有与突变DNA互补的引物扩增出PCR产物,则样品是纯合性突变;而当两对引物均扩增出PCR产物时,样品为杂合子。MAMA对SNP的检出率依赖于反应条件的优化和可能发生的引物与靶DNA有错配时的错配延伸。可以通过调整实验条件如引物、聚合酶、Mg2+的浓度及PCR扩增时各阶段的时间和循环次数来提高反应的特异性。此外,还可以通过人为地使引物3’ 末端的第二个或第三个碱基错配来阻止错误延伸[36,37]。
3.6 温度梯度凝胶电泳(temperature gradient gel electrophoresis,TGGE)  
TGGE也是根据正常DNA片段与含SNP的DNA片段的Tm值不同进行分离的,即一个碱基的突变可以引起在不同温度下DNA双链的解链行为不同,从而引起电泳迁移率的不同,最终达到分离。理想的温度梯度可以通过垂直TGGE(即温度梯度与电泳方向垂直)的方法来优化,它可以分析长度在200~900bp内的双链DNA片段。如果在高Tm值的区段,需在PCR引物的5’端加上一段约40~50bp的GC夹子,但如果SNP在GC富集区,则很难检测到。
3.7 质谱(massspectrometry,MS)法
主要是MALDI-MS(matrix-assisted laser desorption/ionization mass spectrometry)法,是1998年以来出现的新方法。原理是将变性的单链PCR产物通过与硅芯片上的化合物SIAB共价结合后,在硅芯片上进行引物的退火,延伸反应,突变部位配对的碱基与正常配对的碱基不相同。根据引物在延伸反应中所结合的不同碱基的不同质量在质谱仪上显示不同峰。如果事先将碱基进行一定的修饰,比如用荧光染料,可增加四种碱基在质谱仪上的质量差异,可进一步提高敏感性。质谱法的优点在于可检测较大的DNA片段,也可用于小分子DNA片段(<100个bp),其检测速度可达到每天10000个样本,错误率仅为1/10000,且硅芯片可重复使用。缺点是费用昂贵。
3.8 单个碱基延伸标记(single base extension—tag,***E-Tag)法  
是在2000年由Hirschhorn等人报道的新方法[38]。其原理是先筛选出具有相同突变(如A/GSNP)的双链PCR产物作为模板,加入引物及碱基进行反应。引物的5′端连接一个标记序列(tag),约20个核苷酸长,其3′端结束在突变碱基位点前一个碱基处,反应所用的碱基用两种荧光物质标记。反应完毕后置于玻璃板上,其上已排列好与标记序列互补的序列,与***E5′端的tag配对结合。最后可通过比较两种荧光来区分为何种碱基。Hirschhorn等人检测了76个人类SNPs,其中60个显示阳性荧光信号,2个无信号,14个荧光信号过弱。在这60个SNPs中96%被成功识别,经直接测序法证实准确率达99.6%。
3.9 单管双向等位基因扩增法(single-tube bi-directional allele specific amplification,***-ASA)
一个PCR反应体系包含两个3′末端分别与SNP两个等位基因特异结合的引物,它们延伸方向相反,产生长度不同的等位基因专一性扩增产物,同时在两个等位基因特异性引物的3′端第3位碱基引入不配对以增加特异性。PCR产物经琼脂糖凝胶电泳后分析确定样本的基因型。优点是简单快速而有效[39]。
3.10 直接测序技术  
上述各种SNP检测技术检测到的SNP,最后都需要通过测序确定其突变位置和类型。目前由ABI公司推出的ABI3100、ABI3700型和贝克曼公司的CEQ 8000型等DNA遗传分析仪使用4种荧光染料标记引物,进行碱基的DNA合成,经电泳分离后,用激光激发获取片段信息,SNP可以用这种直接测序的方法检出并确认。自动测序仪不仅用四色(或五色)荧光代替了原来手工测序的同位素标记,而且测序和分析数据的时间也大大缩短。特别在通过DNA片段重叠法大规模寻找SNP位点的研究中,测序法采用甚广。
4 其它类型方法
4.1 SNaPshot分析  
某些公司推出了专为检测SNP设计的分析软件和试剂盒,如SNaPshot(Applied Biosystems, ABI)试剂盒,可对多个SNP位点同时进行基因分型,也被称为minisequencing。该方法针对不同突变位点设计不同长度的引物,SNaPshot反应后,产物通过电泳分离、五色荧光检测、GeneScan分析,可在20min内检测10个SNP位点[40]。
4.2 原子探针显微镜  
扫描隧道显微镜(STM)和原子力显微镜(AFM)使快速、高分辨直接观测DNA分子构象成为可能。STM采用导电探针扫描样品表面,分子之间形成的隧道电流通过可连续移动的探头确定样品三维图像。通过STM成功地观测到DNA双螺旋结构和单个碱基对、单链分子中的单个核苷酸,基于扫描速度DNA测序能达1000bp/min以上。AFM是通过测量探针和DNA样品表面间的作用力来确定分子表面形状,不要求样品导电。原子探针显微镜具有直接观测DNA序列的能力,是一种新的高速测序方法,但目前仍处于探索阶段。

四、SNP研究中存在的问题

SNPs的相关研究现在正处于发展之中,虽然它有很好的前景,但目前仍存在不少问题。
1 复杂疾病相关分析中的问题
利用SNP寻找致病基因的工作并不像最初想象的那样简单。研究者除需要大量的SNPs,有时需要弄清被研究人群的历史,如他们的迁移模式等,在对心脏病危险因素LPL基因的研究中,由于减数***中的基因重组,使SNP的关联分析很困难。RosalindHarding用SNPs研究镰刀细胞贫血的β球蛋白基因也遇到了困难,她认为研究者除依靠SNP外,还需知道疾病的模式及被研究人群的历史。其次复杂性疾病很难找到可检测的关联信号,由于其受多个微效基因控制,较难确定病与非病界限的特征,因而很难选择对照组。而且选择多大的样本数量进行研究才是最佳方案也是有待解决的问题。
2 技术问题
目前虽然有大量检测SNP的方法,但大都价格昂贵,速度较慢,这限制了其在相关领域中的应用,所以迫切需要有低成本,高效率的新方法涌现。
3 SNP命名问题
目前没有一个统一标准的命名方法,由于不同SNP由不同实验室测定,现在至少存在六种不同的命名系统,这将给未来的SNP应用带来麻烦。
4 SNPs专利申请问题
由于SNP潜在的巨大价值,所以众多学术机构、商业团体纷纷投入这场争夺SNP的“战役”。目前许多公司如Incyte公司、私营基因组研究所TIGR等正在测SNP(尤其是cSNP),并申请专利,这将阻碍SNP数据共享,不利于其研究。
结语
从某种意义上说,我们已进入SNPs时代,对人类SNPs的发现、描述及其在确定表现型中的成功标志着一个新里程碑的出现。通过大批量、高通量SNPs的发现与鉴定,人类SNP Haplotype遗传图谱的构建,在连锁不平衡基础上的关联分析等,有望为人体致病基因的寻找和疾病的防治提供快速和有效的途径。
有关SNP的研究,包括继续发现未知的SNP,检测已知的SNP,发展更高效可靠的SNP分析方法,开展SNP生物学意义特别是与人类疾病相互关系的研究,更广泛深入地了解SNP,将极大地加深我们对客观世界尤其是我们自身的认识,改善人类的生活环境与生活质量。

参考文献
[1] Brookes A J. Gene, 1999,234:177
[2] Martin E R, et al. AmJHumGenet, 2000,67:383
[3] HorikawaY, et al. NatGenet,2000,26:163
[4] Mullikin J C, et al. Nature,2000,407:516
[5] Johnson G C, Todd J A. Curr Opin Genet Dev, 2000,10:330
[6] Nei M. Molecular Evolutionary Genetics. NewYork: Columbia University Press,1987.28
[7] Halushka M K, et al. Nat Genet,1999,22:239
[8] Chasman D, Adams R M. J Mol Biol,2001,307:683
[9] Sunyaev S, et al. Hum Mol Genet, 2001,10:591
[10] Ng P C, Henikoff S. Genome Research,2001,11:863
[11] Wang D G, et al. Science,1998,280:1077
[12] Sherry S T, et al. Nucleic Acids Res,2001,29:308
[13] Fredman D, et al. Nucleic Acids Res, 2002,30:387
[14] Taillon, et al. Genome Research,1998,8:748
[15] Knight J C, et al. Nat Genet,1999,22(2):145
[16] Martin E R, et al. Am J Hum Genet,2000,67(2):383
[17] 陈怀勇等.生命的化学,2000,20(3):130
[18] Paulussen A, et al. Pharmacogenetics,2000,10(5):415
[19] Bond C, et al. Proc Natl Acad Sci ,1998,95:9608
[20] Gabriele G, et al. Nucleic Acid Res,1997,25(17):3451 [21] Millington W,et al. Antisense Nucleic Acid Drug Dev,1999,9Devil:537
[22] 刘木根, 赵寿元. 生命科学,2000,12Devil:277
[23] Delahunty C, Ankener W, Deng D, et al. Am J Hum Genet,1996,58Devil∶1239.
[24] Holloway J W, et al. Hum Mutat,1999;14(4):340
[25] Tyagi S, et al. Nature Biotechnol,1998;16:49
[26] Delahunty C, et al. Am J Hum Genet,1996;58Devil:1239
[27] Mathias H W, et al. Nature Biotechnol,1999;17(1):87
[28] Knight J C, et al. Clin Chem,1999;45(10):1860
[29] Mathias H W, et al. Nature Biotechnol,1999;17(1):87
[30] Wang D G, et al. Science,1998;280:1077
[31] Fields S, et al. Proc Natl Acad Sci ,1999;96:8825
[32] Pennisi E, et al. Science,1998;280:1692
[33] Liu W G, et al. Nucleic Acids Res,1998;26Devil:1396
[34] Park K C, Park S K, Lee Y S, et al. Jpn J Hum Genet,1996,41:229
[35] Prades C, et al. J Mol Evol,1996,42:37
[36] ChaRS, et al. Methods Appl,1992,2(1):14
[37] Kwo k S, et al. Nucleic Acid Res,1990,18(4):999
[38] Hirschhorn J N, et al. Proc Natl Acad Sci,2000;97:12164
[39] 姜正文,施锦绣等. 中华医学遗传学杂志,2001: 18(4):306-309
[40] Turner D, et al. Human Immunology,2002,63:508
相关网络资源:
I. 由美国国立卫生研究院(National Institutes of Health, NIH)提供的主要是与癌症和肿瘤相关的候选SNP数据库: http://cgap.nci.nih.gov/GAI
II. 由NIH开辟的适于生物医学研究的dbSNP多态数据库: http://www.ncbi.nlm.nih.gov/SNP
III. 由人类基因组组织机构(Human Genome Organization, HUGO)维持的突变数据库: http://ariel.ucs.unimelb.edu.au:80/~cotton/mdi.htm
IV. 由美国白头研究所(Whitehead Institute for Biomedical Research Genome Institute)建立的人类SNP数据库: http://www-genome.wi.mit.edu/SNP/human/index.html
V. 由华盛顿大学(Washington University)支助的按染色体位置组织的SNP数据库: http://www.ibc.wustl.edu/SNP
VI. 由瑞典卡尔林斯卡研究院(Karolinska Institute of Sweden)建立的HGBase数据库:http://hgbase.cgr.ki.se/
VII. 由国际医药与信息加工公司联合组成的SNP 研究联盟(The SNP Consortium, TSC)建立的SNP 数据库:http://snp.cshl.org/db/snp/map
VIII. 由美国国立环境健康科学研究院(National Institute of Environmental Health Science)资助的犹他州大学SNP数据库: http://www.genome.utah.edu/genesnps/



【公告】卫生部关于修订《医师资格考试暂行办法》第三十四条的通知


已读帖子
新的帖子
被删除的帖子
post new topicreply to topic
Jump to the top of page

Welcome to YBY123.COM Forum


Powered by Powerful 智慧医学网® Version Jute 1.8.4 Ent
Enhanced by Distributed Useful ykpass.com Link
Copyright© 2002-2007 Skin JuteSoftware LLC.All Rights Reserved.