分子生物学03 基因及基因组 联系客服

发布时间 : 星期四 文章分子生物学03 基因及基因组更新完毕开始阅读c6fdfad849649b6648d74785

1. 基因认识的三个阶段

? 基因的染色体遗传学阶段

孟德尔遗传因子—约翰逊的基因(给予生命)--摩尔根基因在染色体上《基因论》

? 基因的分子生物学阶段 基因≈顺反子 表型—基因

?

基因的反向生物学阶段 基因—表型

2. 基因的概念

基因:是DNA分子上具有特定功能的(或具有一定遗传效应的)核苷酸序列,是遗传的基本单位。 包括编码序列、调控序列、内含子和编码区两端的非编码序列。 3. 基因概念的扩展

1) 转座成分 移动基因 P38

转座成分(transposable elements) or 移动基因(movable genes): 是一些可以在

染色体基因组上从一个位置转移到另一个位置,甚至在不同染色体之间跃迁的DNA成分。有人将之形象地称为跳跃基因(jumping genes)。

? 玉米糊粉层颜色的控制涉及多对相关基因。C基因为野生型时,胚乳呈紫色,若C基因突变为c阻断了紫色素的合成,那么胚乳为白色。在胚乳发育过程中,若

突变发生回复则导致产生斑点,回复突变发生得越早,产生的紫斑就越大,发生得越晚,则产生的紫斑就越小。McClintock认为突变基因c(无色)是由一个可移动的\控制因子(controlling element)\现称转座子)引起的,称为解离因子(dissociator,Ds),它能合成转座酶,它可以插入到基因C中,即转座。另一个可移动的控制因子是Ac,称激活因子(activator),它的存在可以激活Ds转座进入C基因或别的基因,也能使Ds从基因中转出,使突变基因回复。这就是Ac-Ds系统。

? Ac和Ds这两个因子都位于玉米的第九号染色体短臂,在色素基因C的附近。 Ac

因子全长4.5kb,有5个外显子,其产物是转座酶。Ac因子两端是长11bp的反向重复序列(IR);Ds因子长0.4-4kb,它的中间(在转座酶基因中)有许多种长度不等的缺失, 如Ds9只缺失194bp,而Ds6则缺失2.5kb,Ds的两端也都有11bp的反向重复序列。Ac和Ds的末端反向重复几乎是一样的,只有一个不同之处:Ac两端最外边的核苷酸是彼此不互补的T:G,而Ds是互补的T:A

? 由于缺失转座酶,Ds因子不能自主移动,因此Ds因子是非自主移动的受体因子,

而Ac则为自主移动的调节因子,Ds的转座依赖于Ac元件的存在。Ac、Ds的转座属于非复制机制,即不是复制一份拷贝后将拷贝转移,而是直接从原来位置消失。 2)断裂基因(spliting gene)P38

在编码序列中间插有与氨基酸编码无关的DNA间隔区,这些间隔区称为内含子;而编码区则称为外显子。含有内含子的基因称为不连续基因或断裂基因。

内含子并非都含而不显:有些可以编码与内含子序列的删除或传播扩散相关的蛋白 外显子并非都显:几乎所有的蛋白质基因首尾两个外显子都只有部分核苷酸序列编码氨基酸,亦有完全不编码氨基酸的外显子,如人类尿激酶基因第一个外显子的88个核苷酸

3)假基因 (pseudogene) P39举例说明

是一些核苷酸序列与其相应的正常功能基因基本相同、但却不能合成出功能蛋白质的失活基因。通常积累了较多的突变。现已在大多数真核生物中发现了假基因的存在。假基因数量一般较少。

4)重叠基因(overlapping genes)P40 举例说明

核苷酸序列是彼此重叠的的基因称为重叠基因或嵌套基因(nested genes)。目前已在病毒、噬菌体和少数真核基因中发现了重叠基因。

4. 基因的种类及结构

5. 基因的大小

N值矛盾: 生物体的复杂性与基因数之间并不总是正相关。

K值矛盾: 生物体的复杂性与染色体数之间并不总是正相关。

C值:生物体的单倍体基因组所含DNA总量称为C值。 C值和生物结构或组成的复杂性不一致的现象称为C值悖论(C-value paradox)。 6. 基因组

原核生物基因组的特点:E.coli

? 没有明显的核结构,而形成2-4个DNA相对集中的区域,即类核。

? 基因。

?

染色体DNA是一个由4.6X10碱基对组成的双链环状分子, 含4000多个多种DNA结合蛋白使染色体压缩成一个脚手架(scaffold)结构, 分成大约

6

100个小区(domain)。

1) 相关的结构基因通常构成操纵子。

操纵子(operon):功能上相关的几个结构基因前后相连,由一个共同的调节基因和一组共同的控制位点,即启动子(promoter)和操作子(operator)对其表达过

程实行协同调节控制。细菌基因表达调控的这样一个完整的单元,称为操纵子。

? 调控元(regulon):几个操纵子和它们共同的调节基因所构成的基因表达调控单元。 2)质基因通常以单拷贝形式存在 3)RNA基因通常是多拷贝的

大多数大肠杆菌菌株都有7个核糖体基因(rrn)操纵子,多数rrn操纵子分布在DNA复制起始位点附近,便于这些基因的大量表达和核糖体装配。 4) 其他基因的调控形式多样

质量DNA的提取及注意事项

真核生物基因组:核基因组 线粒体基因组和叶绿体基因组 P44-46

C值矛盾 (C value paradox)与预期的编码蛋白质的基因数量相比,基因组的DNA含量过多; 一些物种的C值与生物体的结构功能复杂性不是正相关;

基因家族(gene family)---真核生物基因组中,来源相同、结构相似、功能相关的一组基因。如人类α珠蛋白和类β珠蛋基因家族

基因簇(gene cluster):基因家族的各成员紧密成簇排列成大段的串联重复单位,定位于染色体的特殊区域。它们是同一个祖先基因扩增的产物。如人类类α链基因簇和类β链基因簇

散布的基因家族:基因家族成员在DNA上无明显的物理联系,甚至分散在多条染色体上。如肌动蛋白基因家族和微管蛋白基因家族。

根据基因家族成员之间序列的相似程度,

基因家族分为:

序列高度同源的经典基因家族 含有高度保守序列的基因家族 含有短的保守序列的基因家族 序列没有同源性的超基因家族 重复基因:串联重复序列 散布的重复序列 串联重复序列:P45 表3-3

卫星DNA:有些高度重复DNA序列的碱基组成和浮力密度同主体DNA有区别,在浮力密度梯度离心时,可形成不同于主DNA带的卫星带,此类DNA称为卫星DNA。

n 重复的DNA序列可以进一步分为卫星DNA(satellite DNA);

n 小卫星DNA(minisatellite DNA)

n 微卫星DNA(microsatellite DNA)三类 散布的重复序列:

短散布元件 (Short interpersed element, SINE): 重复序列长度在500bp以下 长散布元件(Long interpersed element, LINE): 重复序列长度在1000bp以上

细胞器基因组:

? ? ? ? ?

绝大多数为环状,少数低等真核生物为线性分子; 线粒体DNA为十几~几十kb,叶绿体可达二百多kb; 细胞器基因组编码自身所需的某些蛋白质以及tRNA和rRNA; 有自己的蛋白质合成体系; 有些蛋白质由核基因编码;

人类线粒体基因组的特点

(1)有37个基因,13个蛋白质基因,2个rRNA基因,22个tRNA基因 (2)DNA利用效率极高

基因排列紧密(间隔区只占DNA总长度的0.5%); 有重叠基因; (3)有特殊的终止密码子

AGA或AGG(核基因密码子编码Arg) 而核基因终止密码为 UAG,UAA,UGA 由线粒体内的蛋白质翻译机器完成自身基因的翻译 有特殊的起始密码子(AUA,AUU) mRNA的非翻译区极少

对抑制原核生物蛋白质合成的抗生素敏感

7. 人类基因组计划及延伸研究

结构基因组学(Structure Genomics) finding out the sequences of genomes.

功能基因组学(Functional Genomics) probing the pattern of gene expression in a given cell type at a given time.

转录组学(transcriptomics)consider all the transcripts an organism can make in its lifetime. 蛋白组学(proteomics)

consider the properties and activities of all the proteins an organism makes in its lifetime. ? ? ? ?

药物基因组学(Pharmacogenomics) 环境基因组学(Enviromental Genomics) 比较基因组学 ……

研究技术

生物芯片(microarray)

转基因和基因敲除(transgene and gene knockout) 酵母双杂交(yeast two-hybrid system) 二维电泳(2D)

生物信息学(Bioinformatics)

本章重点:

1. 基因概念的发展史

2. 真核生物和原核生物基因组成的基本元件 3. 人类基因组计划的意义

作业:

1. 简述基因概念发展史

2. 名词解释:基因(顺反子),移动基因, 断裂基因,假基因,重叠基因,基因组

3. 原核基因和真核基因的典型结构及各元件的功能

4. 简述Ac/Ds系统