第三节 DNA的二级结构与功能
(一)DNA的二级结构?双螺旋结构模型(double helixmodel)
1953年,Watson和Crick提出了著名的DNA分子的双螺旋结构模型,揭示了遗传信息是如何储存在DNA分子中,以及遗传性状何以在世代间得以保持。这是生物学发展的重大里程碑。
在DNA双螺旋结构模型建立之前,早在1868年,Miescher已经从脓细胞提取到核酸与蛋白质的复合物,当时称为核素(nuclein)。但核酸在生命活动中的重要地位,却迟至本世纪50年代才被认识。
本世纪20年代,Levene研究了核酸的化学结构并提出四核苷酸假说;40年代末,Avery,Hershey和Chase的实验严密地证实了DNA就是遗传物质;50年代初,Chargaff应用紫外分光光度法结合纸层析等简单技术,对多种生物DNA作碱基定量分析,发现DNA碱基组成有如下规律(表15-3)。
表15-3 不同生物来源的DNA四种碱基比例关系
DNA来源 | 腺嘌呤(A) | 胸腺嘧啶(T) | 鸟嘌呤(G) | 胞嘧啶(C) | (A+T)/(G+C) |
大肠杆菌 | 25.4 | 24.8 | 24.1 | 25.7 | 1.01 |
小麦 | 26.8 | 28.0 | 23.2 | 22.7 | 1.21 |
鼠 | 29.7 | 25.6 | 21.9 | 22.8 | 1.21 |
猪:肝 | 29.4 | 29.7 | 20.5 | 20.5 | 1.43 |
胸腺 | 30.0 | 28.9 | 20.4 | 20.7 | |
脾 | 29.6 | 29.2 | 20.4 | 20.8 | |
酵母 | 31.3 | 32.9 | 18.7 | 17.5 | 1.079 |
(1)同一生物的不同组织的DNA碱基组成相同;
(2)一种生物DNA碱基组成不随生物体的年龄、营养状态或者环境变化而改变;
(3)几乎所有的DNA,无论种属来源如何,其腺嘌呤摩尔含量与胸腺嘧啶摩尔含量相同(A]=[T),鸟嘌呤摩尔含量与胞嘧啶摩尔含量相同(G]=[C),总的嘌呤摩尔含量与总的嘧啶摩尔含量相同([A+G]=[C]+[T)。
(4)不同生物来源的DNA碱基组成不同,表现在A+T/G+C比值的不同;
这些结果后来为DNA的双螺旋结构模型提供了一个有力的佐证。
Watson和Crick以立体化学原理为准则,对Wilkins和Franklin的DNa X?射线衍射分析结果加以研究,提出了DNA结构的双螺旋模式,其主要内容如下:
图15-5 DNA的双螺旋结构模式
A.正面观:长方框内有详细说明,S代表脱氧核糖。
B.俯视:涂黑的是碱基,此处全部碱基都是嘧啶,只看到糖的侧面略呈三角形,最外围是磷酸及其酯键。
(1)在DNA分子中,两股DNA链围绕一假想的共同轴心形成一右手螺旋结构,双螺旋的螺距为3.4nm,直径为2.0nm。(图15-5,?A,B)。
(2)链的骨架(backbone)由交替出现的、亲水的脱氧核糖基和磷酸基构成,位于双螺旋的外侧。
(3)碱基位于双螺旋的内侧,两股链中的嘌呤和嘧啶碱基以其疏水的、近于平面的环形结构彼此密切相近,平面与双螺旋的长轴相垂直。一股链中的嘌呤碱基与另一股链中位于同一平面的嘧啶碱基之间以氢链相连,称为碱基互补配对或碱基配对(base pairing),碱基对层间的距离为0.34nm。碱基互补配对总是出现于腺嘌呤与胸腺嘧啶之间(A=T),形成两个氢键;或者出现于鸟嘌呤与胞嘧啶之间(G=C),形成三个氢键。(图15-6)。
图15-6 A-T,G-C间的氢键形成
(4)DNA双螺旋中的两股链走向是反平行的,一股链是5′→3′走向,另一股链是3′→5′走向。两股链之间在空间上形成一条大沟(major groove)和一条小沟(minor groove),这是蛋白质识别DNA的碱基序列,与其发生相互作用的基础。
DNA双螺旋的稳定由互补碱基对之间的氢键和碱基对层间的堆积力(base?stacking force)维系。DNA双螺旋中两股链中碱基互补的特点,逻辑地预示了DNA复制过程是先将DNA分子中的两股链分离开,然后以每一股链为模板(亲本),通过碱基互补原则合成相应的互补链(复本),形成两个完全相同的DNA分子。因为复制得到的每对链中只有一条是亲链,即保留了一半亲链,将这种复制方式称为DNA的半保留复制(semi?conservativereplication)。后来证明,半保留复制是生物体遗传信息传递的最基本方式。
DNA双螺旋是核酸二级结构的重要形式。双螺旋结构理论支配了近代核酸结构功能的研究和发展,是生命科学发展史上的杰出贡献。
(二)DNA结构的多态性
Watson和Crick提出的DNA双螺旋结构属于B型双螺旋,它是以在生理盐溶液中抽出的DNA纤维在92%相对湿度下进行X-射线衍射图谱为依据进行推测的,这是DNA分子在水性环境和生理条件下最稳定的结构。然而以后的研究表明DNA的结构是动态的。在以钾或绝作反离子,相对湿度为75%时,DNA分子的X-射线衍射图给出的是A构象,A-DNA每螺旋含11个碱基对,而且变成A-DNA后,大沟变窄、变深,小沟变宽、变浅。由于大沟、小沟是DNA行使功能时蛋白质的识别位点,所以由B-DNA变为A-DNA后,蛋白质对DNA分子的识别也发生了相应变化。
一般说来,A-T丰富的DNA片段常呈B-DNA。采用乙醇沉淀法纯化DNA时,整个过程中,大部分DNA由B-DNA经过C-DNA,最终变构为A-DNA。若DNA双链中一条链被相应的RNA链所替换,会变构成A-DNA。当DNA处于转录状态时,DNA模板链与由它转录所得的RNA链间形成的双链就是A-DNA。由此可见A-DNA构象对基因表达有重要意义。此外,B-DNA双链都被RNA链所取代而得到由两条RNA链组成的双螺旋结构也是A-DNA。除A-DNA、B-DNA螺旋外,还存在B′-DNA、C-DNA、D-DNA等,其结构参数见表15-4。
表15-4 不同右手双螺旋DNA的结构参数
双螺旋 | 碱基倾 | 碱基夹 | 碱基间距 | 螺距 | 每轮碱 | 小沟宽/nm× | 大沟宽nm× |
角/(°) | 角(°) | /nm | /nm | 基数 | 小沟宽nm | 大沟宽nm | |
B-DNA | 0 | 36.0 | 0.337 | 3.4 | 10 | 0.57×0.75 | 1.17×0.85 |
C-DNA | 6 | 38.0 | 0.331 | 3.1 | 9.3 | 0.48×0.79 | 1.05×0.75 |
D-DNA | 45.0 | 0.303 | 0.13×0.67 | 0.89×0.58 | |||
A-DAN | 20 | 32.7 | 0.256 | 2.8 | 11 | 1.10×0.28 | 0.27×1.35 |
总之,DNA的双螺旋结构永远处于动态平衡中,DNA分子构象的变化与糖基和碱基之间空间相对位置有关。
1979年,Wang和Rich等人在研究人工合成的CGCGCG单晶的X-射线衍射图谱时出人意料地发现这种六聚体的构象与上面讲到的完全不同。它是左手双螺旋,与右手螺旋的不同是螺距延长(4.5nm左右),直径变窄(1.8nm),每个螺旋含12个碱基对,分子长链中磷原子不是平滑延伸而是锯齿形排列,有如“之”字形一样,因此叫它Z构象(英文字Zigzag的第一个字母)。还有,这一构象中的重复单位是二核苷酸而不是单核苷酸;而且Z?DNA只有一个螺旋沟,它相当于B构象中的小沟,它狭而深,大沟则不复存在(图15-7)。进一步的分析还证明,Z-DNA的形成是DNA单链上出现嘌呤与嘧啶交替排列所成的。比如CGCGCGCG或者CACACACA。
图15-7 Z-DNA和B-DNA
Z-DNA有什么生物学意义呢?应当指出Z-DNA的形成通常在热力学上是不利的。因为Z-DNA中带负电荷的磷酸根距离太近了,这会产生静电排斥。但是,DNA链的局部不稳定区的存在就成为潜在的解链位点。DNA解螺旋却是DNA复制和转录等过程中必要的环节,因此认为这一结构与基因调节有关。比如SV40增强子区中就有此结构,又如鼠类微小病毒DNS复制区起始点附近有GC交替排列序列。此外,DNA螺旋上沟的特征在其信息表达过程中起关键作用。调控蛋白都是通过其分子上特定的氨基酸侧链与DNA双螺旋沟中的碱基对一侧的氢原子供体或受体相互作用,形成氢键从而识别DNA上的遗传信息的。大沟所带的遗传信息比小沟多。沟的宽窄和深浅也直接影响到调控蛋白质对DNA信息的识别。Z?DNA中大沟消失,小沟狭而深,使调控蛋白识别方式也发生变化。这些都暗示Z?DNA的存在不仅仅是由于DNA中出现嘌呤一啶嘧交替排列之结果,也一定是在漫漫的进化长河中对DNA序列与结构不断调整与筛选的结果,有其内在而深刻的含意,只是人们还未充分认识而已。
DNA构象的可变性,或者说DNA二级结构的多态性的发现拓宽了人们的视野。原来,生物体中最为稳定的遗传物质也可以采用不同的姿态来实现其丰富多采的生物学功能。
多年来,DNA结构的研究手段主要是X射线衍射技术,其结果是通过间接观测多个DNA分子有关结构参数的平均值而获得的。同时,这项技术的样品分析条件使被测DNA分子与天然状态相差甚远。因此,在反映DNA结构真实性方面这种方法存在着缺陷。1989年,应用扫描隧道显微镜(scanning tummelingmicroscopy,STM)研究DNA结构克服了上述技术的缺陷。这种先进的显微技术,不仅可将被测物放大500万倍,且能直接观测接近天然条件下单个DNA分子的结构细节。STM技术的应用是DNA结构研究中的重要进展,可望在探索DNA结构的某些未知点上展示巨大潜力。
(三)DNA结构的不均一性(heterogeneity)
在DNA的一级结构中,四种碱基A,T,C,G远非均匀分布,尽管双螺旋的构型大体相同,但沿着DNA链各处的物理结构不完全相同,各处双螺旋的稳定性也就显示出差别,充分体现了DNA一级结构决定高级结构的原理。其不均一性主要有:
1.反向重复序列(inverted repeats)
又称回文序列(palindrome),它能在DNA或RNA中形成发夹结构。这种回文结构通常是作为一种特别信号,如限制性核酸内切酸(restriction encl闩迥onuclease)及调节蛋白的识别位点,转录终止信号等。
2.富含A/T的序列
在高等生物中,A+T与G+C的含量差不多相等,然而在它们的染色体某一区域,A·T含量可能相当高。如在很多有重要调节功能的DNA区段都富含A·T,特别是在复制起点和启动子的Pribnow框(真核生物为TATA框)的序列中,其对于复制和起始十分重要。因为A-T对只有二条氢键,此处的双链较G-C对处易于解开,有利于起始复合物的形成。
3.嘌呤和嘧啶的排列顺序对双螺旋结构稳定性的影响。
人们考察了十种相邻的二核苷酸对(nearest?neighbor doublets),发现一个非常有趣的现象,那就是碱基组成相同,但嘌呤和嘧啶的排列顺序不同,双螺旋的稳定性具有显著的差异。例如5′Gc3′ 3′G 5′和5′GC 3′ 3′GC 5′的稳定性相差很大,前者的稳定性远大于后。它们的氢键数目是相同的,它们的差别在于相邻碱基之间的堆集力不同。即从嘌呤到嘧啶的方向的碱基堆集作用显著地大于同样组成的嘧啶到嘌呤方向的碱基堆集作用。(这里的方向就是常规的从5′端到3′端的方向)。这是因为前者的嘌呤环和嘧啶环重迭面积大于后者的嘧啶环和嘌呤环的重迭面积,这在B型DNA中确是如此。
根据Gotoh 1981年的研究,十种相邻二核苷酸对的Tm值如表15?所示,单位为℃,所用离子强度为19.5mmol/l Na+。
表15-5 相邻二核苷酸对Tm值
3′ | |||||
A | T | G | C | ||
5′ | A | 54.50 | 57.02 | 58.42 | 97.73 |
T | 36.73 | 54.50 | 54.71 | 86.44 | |
G | 86.44 | 97.73 | 85.97 | 136.12 | |
C | 54.71 | 58.42 | 72.55 | 85.97 |
由表15-5可以看到,5′TA 3′ 3′AT5′的Tm值最低。在真核生物中,常可以在?19到?27的位置上看到一个叫做TATA框的结构(又称Hogness框),这是RNA聚合酶的结合位点。在这里RNA聚合酶和有关蛋白质因子形成转录起始复合物。
又如,生命有机体选择UAA作为最有效的终止密码子绝不是偶然的,因为64个三联体密码子中,它与反密码子(假定有的话)形成的互补产物5′UAA3′3′AUU5′的Tm值是最低的一个,即使在生理温度下也是不稳定的。当初有人花了很多工夫去寻找一个不携带氨基酸的专供肽链终止用的tRNA,其实并不存在这种tRNA。肽链的释放是由释放因子RF在起作用。在三种终止密码子中,UAG和UGA常会为突变型的tRNA无义抑制,而UAA则很少发生无义抑制也可能就是这个道理。这也就说明了为什么在肽链终止处常常会出现双重终止密码子。
(四)DNA的变性、复性与分子杂交
DNA双螺旋结构模型,不仅与其生物功能有密切关系,还能解释DNA的重要特性枣变性与复性,这对于深入了解DNA分子结构与功能的关系又有重要意义。
1.DNA变性(denaturation)
指DNA分子由稳定的双螺旋结构松解为无规则线性结构的现象。变性时维持双螺旋稳定性的氢键断裂,碱基间的堆积力遭到破坏,但不涉及到其一级结构的改变。凡能破坏双螺旋稳定性的因素,如加热、极端的pH、有机试剂甲醇、乙醇、尿素及甲酰胺等,均可引起核酸分子变性。变性DNA常发生一些理化及生物学性质的改变:
溶液粘度降低。DNA双螺旋是紧密的刚性结构,变性后代之以柔软而松散的无规则单股线性结构,DNA粘度因此而明显下降。
溶液旋光性发生改变。变性后整个DNA分子的对称性及分子局部的构性改变,使DNA溶液的旋光性发生变化。
15-8 核酸的解链曲线
增色效应(hyperchromiceffect)。指变性后DNA溶液的紫外吸收作用增强的效应。DNA分子中碱基间电子的相互作用使DNA分子具有吸收260nm波长紫外光的特性。在DNA双螺旋结构中碱基藏入内侧,变性时DNA双螺旋解开,于是碱基外露,碱基中电子的相互作用更有利于紫外吸收,故而产生增色效应。
对双链DNA进行加热变性,当温度升高到一定高度时,DNA溶液在260nm处的吸光度突然明显上升至最高值,随后即使温度继续升高,吸光度也不再明显变化。若以温度对DNA溶液的紫外吸光率作图,得到的典型DNA变性曲线呈S型(图15?8)。可见DNA变性是在一个很窄的温度范围内发生的。通常将核酸加热变性过程中,紫外光吸收值达到最大值的50%时的温度称为核酸的解链温度,由于这一现象和结晶的融解相类似,又称融解温度(Tm,meltingtemperature)。在Tm时,核酸分子内50%的双螺旋结构被破坏。特定核酸分子的Tm值与其G+C所占总碱基数的百分比成正相关,两者的关系可表示为:
Tm=69.3+0.41(%G+C)
一定条件下(相对较短的核酸分子),Tm值大小还与核酸分子的长度有关,核酸分子越长,Tm值越大;另外,溶液的离子强度较低时,Tm值较低,融点范围也较宽,反之亦然,因此DNA制剂不应保存在离子强度过低的溶液中。
2.DNA复性(renaturation)
指变性DNA在适当条件下,二条互补链全部或部分恢复到天然双螺旋结构的现象,它是变性的一种逆转过程。热变性DNA一般经缓慢冷却后即可复性,此过程称之为退火(annealing)。这一术语也用以描述杂交核酸分子的形成(见后)。DNA的复性不仅受温度影响,还受DNA自身特性等其它因素的影响:
温度和时间。一般认为比Tm低25℃左右的温度是复性的最佳条件,越远离此温度,复性速度就越慢。复性时温度下降必须是一缓慢过程,若在超过Tm的温度下迅速冷却至低温(如4℃以下),复性几乎是不可能的,核酸实验中经常以此方式保持DNA的变性(单链)状态。这说明降温时间太短以及温差大均不利于复性。
DNA浓度。溶液中DNA分子越多,相互碰撞结合的机会越大。
DNA顺序的复杂性。简单顺序的DNA分子,如多聚(A)和多聚(U)这二种单链序列复性时,互补碱基的配对较易实现。而顺序复杂的序列要实现互补,则困难得多。在核酸复性研究中,定义了一个Cot的术语,(Co为单链DNA的起始浓度,t是以秒为单位的时间),用以表示复性速度与DNA顺序复杂性的关系。在探讨DNA顺序对复性速度的影响时,将温度、溶剂离子强度、核酸片段大小等其它影响因素均予以固定,以不同程度的核酸分子重缔合部分(在时间t时的复性率)对Cot作图,可以得到如图15-9所示的曲线。曲线上方为示复杂性的核酸分子的非重复碱基对数。如多聚(A)的复杂性为1,重复的(ATGC)n组成的多聚体的复杂性为4,分子长度是105核苷酸对的非重复DNA的复杂性为105。原核生物基因组均为非重复顺序,故以非重复核苷酸对表示的复杂性直接体现基因组大小(图上方的箭头所指为基因大小),对于真核生物基因组中的非重复片段也是如此。在标准条件下(一般为0.18ml/L阳离子浓度,400核苷酸长的片段)测得的复性率达0.5时的Cot值(称Cot1/2),与核苷酸对的复杂性成正比。对于原核生物核酸分子,此值可代表基因组的大小及基因组中核苷酸对的复杂程度。真核基因组中因含有许多不同程度的重复序列(repetitive sequence),所得到的Cot曲线更为复杂。
图15-9 不同物种核酸的Cot曲线
DNA的变性和复性原理,现已在医学和生命科学上得到广泛的应用。如核酸杂交与探针技术,聚合酶链反应(polymerasechain reaction,PCR)技术等。
3.分子杂交:(hybridization)
不同来源的核酸变性后,合并在一处进行复性,这时,只要这些核酸分子的核苷酸序列含有可以形成碱基互补配对的片段,复性也会发生于不同来源的核酸链之间,形成所谓的杂化双链(heterodup lex),这个过程称为杂交(hybridization)图15-10,I)。杂交可以发生于DNA与DNA之间,也可以发生于RNA与RNA之间和DNA与RNA之间。例如,一段天然的DNA和这段DNA的缺失突变体(假定这种突变是DNA分子中部丢失了若干碱基对)一起杂交,电子显微镜下可以看到杂化双链中部鼓起小泡。测量小泡位置和长度,可确定缺失突变发生的部位和缺失的多少。核酸杂交技术是目前研究核酸结构、功能常用手段之一,不仅可用来检验核酸的缺失、插入,还可用来考察不同生物种类在核酸分子中的共同序列和不同序列以确定它们在进化中的关系。其应用当然远不止于确定突变位置这一例(图15-10Ⅱ)。
图15-10 核酸杂交及其应用示意图
Ⅰ.变性、复性和杂交。粗细线分别代表不同DNA。A是杂化双链
Ⅱ.突变体的鉴别。B代表天然DNA;C是B的缺失突变体;虚线框内是已缺失的部分;
D是显示从天然DNA链鼓出小泡 Ⅲ.粗线代表探针,粗线上的X表示放射性标记
在核酸杂交的基础上发展起来的一种用于研究和诊断的非常有用的技术称探针技术(Probe)。一小段(例如十数个至数百个)核苷酸聚合体的单链,有放射性同位素如32P、35S或生物素标记其末端或全链,就可作为探针。把待测DNA变性并吸附在一种特殊的滤膜,例如硝酸纤维素膜上。然后把滤膜与探针共同培育一段时间,使发生杂交。用缓冲液冲洗膜。由于这种滤膜能较牢固地吸附双链的核酸,单链的在冲洗时洗脱了。带有放射性的探针若能与待测DNA结合成杂化双链,则保留在滤膜上。通过同位素的放射自显影或生物素的化学显色,就可判断探针是否与被测的DNA发生杂交。有杂交现象则说明被测DNA与探针有同源性(homogeneity),即二者的碱基序列是可以互补的。例如:想知道某种病毒是否和某种肿瘤有关,可把病毒的DNA制成探针。从肿瘤组织提取DNA,与探针杂交处理后,有杂化双链的出现,就说明两种DNA之间有同源性。这不等于可以说这种病毒引起肿瘤,但至少这是可以继续深入研究下去的一条重要线索。
探针技术(图15-10Ⅲ)在遗传性疾病诊断上已开始应用。例如诊断地中海贫血或血红蛋白病,可以由已确诊的病人白细胞中提取DNA,这就是诊断探针。用诊断探针检查,不但可以对有症状患者进行确诊,还可以发现一些没有症状的隐性遗传性疾病。从胎儿的羊水也可以提取到少量DNA。由于探针技术比较灵敏,就使遗传性疾病的产前诊断较为容易办得到了。杂交和探针技术是许多分子生物学技术的基础,在生物学和医学的研究中,以及临床诊断中得到了日益广泛的应用。