——摘转自《百度百科》
基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。
带有遗传信息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传信息的表现。组成简单生命最少要265到350个基因。(这涉及基因工作组的力量,人类的基因工作组与果蝇的基本相似)
在格雷戈尔·孟德尔之前,人们曾认为遗传是一个混合过程,但是孟德尔证实存在一种不可分割和独立的遗传单位,后来人们证实这种遗传单位就是存在于染色体上的基因——一段DNA序列。孟德尔在基因水平上揭示了有性生殖的遗传过程(称之为“分离定律”与“自由组合”定律),虽然他那时并不知道基因的真实存在形式 [1]。注意基因和DNA是完全不同的概念。
一、基因历史
基因是控制生物性状的基本遗传单位。
19世纪60年代,奥地利遗传学家格雷戈尔·孟德尔就提出了生物的性状是由遗传因子控制的观点,但这仅仅是一种逻辑推理。20世纪初期,遗传学家摩尔根通过果蝇的遗传实验,认识到基因存在于染色体上,并且在染色体上是呈线性排列,从而得出了染色体是基因载体的结论。1909年丹麦遗传学家约翰逊(W. Johansen,1859~1927)在《精密遗传学原理》一书中正式提出“基因”概念。
20世纪50年代以后,随着分子遗传学的发展,尤其是沃森和克里克提出DNA双螺旋结构以后,人们进一步认识了基因的本质,即基因是具有遗传效应的DNA片段。研究结果还表明,每条染色体只含有1~2个DNA分子,每个DNA分子上有多个基因,每个基因含有成百上千个脱氧核苷酸。自从RNA病毒发现之后,基因的存在方式不仅仅只存在于DNA上,还存在于RNA上。由于不同基因的脱氧核糖核苷酸的排列顺序(碱基序列)不同,因此,不同的基因就含有不同的遗传信息。1994年中科院曾邦哲提出系统遗传学概念与原理,探讨猫之为猫、虎之为虎的基因逻辑与语言,提出基因之间相互关系与基因组逻辑结构及其程序化表达的发生研究。
二、基因分类
(一)结构基因
基因中编码RNA或蛋白质的碱基序列。
(1)原核生物结构基因:连续的,RNA合成不需要剪接加工;
(2)真核生物结构基因:由外显子(编码序列)和内含子(非编码序列)两部分组成。
(二)非结构基因
结构基因两侧的一段不编码的DNA片段(即侧翼序列),参与基因表达调控。
(1)顺式作用元件:能影响基因表达,但不编码RNA和蛋白质的DNA序列;
其中包括:
启动子:RNA聚合酶特异性识别结合和启动转录的DNA序列。有方向性,位于转录起始位点上游。
上游启动子元件:TATA盒上游的一些特定DNA序列,反式作用因子可与这些元件结合,调控基因的转录效率。
反应元件:与被激活的信息分子受体结合,并能调控基因表达的特异DNA序列。
增强子:与反式作用因子结合,增强转录活性,在基因任意位置都有效,无方向性。
沉默子:基因表达负调控元件,与反式作用因子结合,抑制转录活性。
Poly(A)加尾信号:结构基因末端保守的AAUAAA顺序及下游GT或T富含区,被多聚腺苷酸化特异因子识别,在mRNA 3′端加约200个A。
(2)反式作用因子:能识别和结合特定的顺式作用元件,并影响基因转录的一类蛋白质或RNA。
三、基因特点
基因有两个特点:一是能忠实地复制自己,以保持生物的基本特征;二是在繁衍后代上,基因能够“突变”和变异,当受精卵或母体受到环境或遗传的影响,后代的基因组会发生有害缺陷或突变。绝大多数产生疾病,在特定的环境下有的会发生遗传。也称遗传病。在正常的条件下,生命会在遗传的基础上发生变异,这些变异是正常的变异。
含特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。除某些病毒的基因由核糖核酸(RNA)构成以外,多数生物的基因由脱氧核糖核酸(DNA)构成,并在染色体上作线状排列。基因一词通常指染色体基因。在真核生物中,由于染色体在细胞核内,所以又称为核基因。位于线粒体和叶绿体等细胞器中的基因则称为染色体外基因、核外基因或细胞质基因,也可以分别称为线粒体基因、质粒和叶绿体基因。
在通常的二倍体的细胞或个体中,能维持配子或配子体正常功能的最低数目的一套染色体称为染色体组或基因组,一个基因组中包含一整套基因。相应的全部细胞质基因构成一个细胞质基因组,其中包括线粒体基因组和叶绿体基因组等。原核生物的基因组是一个单纯的DNA或RNA分子,因此又称为基因带,通常也称为它的染色体。
基因在染色体上的位置称为座位,每个基因都有自己特定的座位。在同源染色体上占据相同座位的不同形态的基因都称为等位基因。在自然群体中往往有一种占多数的(因此常被视为正常的)等位基因,称为野生型基因;同一座位上的其他等位基因一般都直接或间接地由野生型基因通过突变产生,相对于野生型基因,称它们为突变型基因。在二倍体的细胞或个体内有两个同源染色体,所以每一个座位上有两个等位基因。如果这两个等位基因是相同的,那么就这个基因座位来讲,这种细胞或个体称为纯合体;如果这两个等位基因是不同的,就称为杂合体。在杂合体中,两个不同的等位基因往往只表现一个基因的性状,这个基因称为显性基因,另一个基因则称为隐性基因。在二倍体的生物群体中等位基因往往不止两个,两个以上的等位基因称为复等位基因。不过有一部分早期认为是属于复等位基因的基因,实际上并不是真正的等位,而是在功能上密切相关、在位置上又邻接的几个基因,所以把它们另称为拟等位基因。某些表型效应差异极少的复等位基因的存在很容易被忽视,通过特殊的遗传学分析可以分辨出存在于野生群体中的几个等位基因。这种从性状上难以区分的复等位基因称为同等位基因。许多编码同工酶的基因也是同等位基因。
属于同一染色体的基因构成一个连锁群(见连锁和交换)。基因在染色体上的位置一般并不反映它们在生理功能上的性质和关系,但它们的位置和排列也不完全是随机的。在细菌中编码同一生物合成途径中有关酶的一系列基因常排列在一起,构成一个操纵子(见基因调控);在人、果蝇和小鼠等不同的生物中,也常发现在作用上有关的几个基因排列在一起,构成一个基因复合体或基因簇或者称为一个拟等位基因系列或复合基因。