发布时间 : 星期一 文章生物信息学课程论文.doc更新完毕开始阅读5c9f5d6419e8b8f67c1cb9ac
[键入文字]
生物信息学结课论文
[键入文字]
番茄WRKY26基因的生物信息学分析
摘要:番茄(Lyeopersicon escaleutum.Mil1)是世界上重要的蔬菜作物之一,已
经成为蔬菜基因工程研究的模式植物之一。由于环境污染,气候条件不断恶化,使地球上的生物生存环境遭受到越来越严重的危害,因此番茄非生物抗逆性改良的研究工作就更显得迫切和重要。已有研究证明WRKY转录因子可参与多种植物抗性反应, WRKY26基因存在于番茄中,其编码的WRKY26转录因子对番茄抗旱性有重要调控作用,研究其生物学功能显得尤为重要。本文采用生物信息学的方法对已在 GenBank 上登录的番茄WRKY26基因的核酸及氨基酸序列、组成成分、同源性比对、编码蛋白质的理化性质、信号肽、跨膜结构域、亲、疏水性、蛋白质结构及功能域等进行预测和推断。结果表明:该基因的ORF长度为1608bp且与马铃薯STWRKY8同源性很高,该基因编码的蛋白质分子量为分子量为59624.9, 等电点为6.87,为酸性疏水性蛋白质,且不稳定。该蛋白质无信号肽和跨膜结构域,属于非分泌蛋白质。蛋白质结构表明该蛋白主要为β转角和无规则卷曲,没有α螺旋。通过此次研究,希望为今后深入研究该类基因的功能和结构特征提供依据。
关键词:番茄;WRKY26基因;蛋白质功能;同源性
前言
番茄基因组中,数目众多的转录因子参与植物的生长发育、物质代谢、响应生物和非生物胁迫等多种生物进程。WRKY基因家族是植物重要的转录因子家族,在抗病信号转导途径中起重要调控作用,因而成为分子植物病理研究领域中的热点。WRKY转录因子是一类植物所特有的抗逆相关转录因子超家族,在植物生物、非生物胁迫[1]以及植物的生长发育和多种代谢途[2]的调控中起重要作用。
近年来的研究发现,转录因子和抗逆基因会对环境胁迫作出响应。一个抗逆基因的超表达只能提高植物单一抗性,而一个转录因子基因的超表达能够激活多个下游抗逆基因的表达,从而提高植物综合抗逆能力。所以与单抗基因相比,转录因子已成为作物改良的研究热点。尤其是WRKY转录因子,因其可显著地调控植物生物和非生物胁迫,更是备受关注[3]。WRKY家族中的大部分成员受到水杨酸(SA)、NaCl、低温等刺激后会诱导表达[4-6]。Qiu等[7]发现OsWRKY45可在病原菌的诱导下表达,并提高转基因拟南芥的抗病性,说明WRKY基因还具有潜在的抗病能力。现已证明WRKY可参与多种植物抗病反应[8]。番茄作为重要的模式植物周年生产中常受到高盐、低温、病原菌的影响,其遗传改良越来越受到重视[9]。所以研究WRKY26基因的生物信息学功能显得尤为重要,可以为转基因番茄等其他遗传操作提供技术储备。
一.基因的查找,在NCBI中查找基因序列
mRNA sequence
>gi|723709376|ref|XM_004241707.2| PREDICTED: Solanum lycopersicum probable WRKY transcription factor 26 (LOC101255501), mRNA
1
[键入文字]
生物信息学结课论文
[键入文字]
GTATCTTCTTTCTTTTAATGGCTGCTTCAAGTTTCTCTTTTCCCACTTCATCTTCTTCATTCATGACGACTTCTTTCACCGACCTTCTTGCTTCTGATGATTATCCAACCAAAGGACTTGCTGATAGAATTGCAGAGAGGACTGGTTCTGGAGTTCCTAAATTCAAATCTCTTCCACCTCCTTCACTTCCATTATCGCCTCCTCCTTTTTCGCCTTCCTCTTACTTTGCTATTCCTCCTGGTTTAAGTCCAACTGAACTTTTAGACTCCCCTGTTCTTTTGTCTTCTTCAAACCTTCTTCCATCTCCGACGACTGGGAGTTTTCCATCTCGTGCTTTTAATTGGAAGAGCAGTAGTCATCAGGATGTGAAACAGGAAGACAAAAACTACTCAGATTTTTCTTTCCAGCCTCAAGTAGGGACAGCTGCATCATCAATCTCTCAATCTCAAACTAACCATGTCCCTCTGGGGCAGCAAGCATGGAATTGTCAAGAGCCCACAAAACAGAATGATCAAAATGCTAATGGAAGATCCGAATTCAACACTGTACAGAATTTTATGCAGAATAATAATGATCAGAACAATAGTGGAAACCAATACAATCAGAGTATAAGGGAGCAGAAAAGGTCAGATGACGGATACAATTGGAGGAAATACGGGCAGAAACAAGTAAAAGGTAGTGAAAATCCGAGAAGCTACTACAAGTGTACATACCCAAATTGTCCCACCAAGAAGAAGGTTGAGAGATCTTTAGATGGTCAAATTACTGAAATTGTGTACAAGGGTAATCACAACCATCCAAAGCCTCAGTCTACCAGAAGATCGTCATCATCCACAGCTTCATCTGCATTCCAATCTTACAATACACAAACTAATGAAATTCCAGATCATCAATCCTATGGTTCAAATGGACAAATGGATTCCGTTGCAACACCTGAGAATTCTTCGATTTCATTTGGGGATGATGATCATGAACACACTTCTCAAAAGAGTAGTAGGTCAAGAGGAGATGATCTTGATGAAGAGGAACCAGACTCAAAAAGATGGAAAAGAGAAAACGAAAGTGAAGGTGTATCTGCACTAGGAGGGAGTAGGACAGTTAGAGAACCTAGAGTTGTAGTTCAAACTACGAGTGACATCGATATCCTAGATGATGGTTATAGATGGAGGAAGTATGGTCAAAAAGTAGTGAAAGGAAATCCTAATCCCAGGAGCTACTACAAATGCACAAGTACGGGATGTCCAGTAAGAAAACATGTGGAAAGGGCATCACAAGACATAAGGTCAGTGATAACAACCTATGAAGGGAAGCACAACCATGATGTTCCAGCAGCAAGGGGCAGTGGCAACCACTCAATTAACCGACCTATGGCACCGACCATAAGGCCTACTGTGACATCTCATCAATCCAACTATCAAGTTCCATTACAAAGTATAAGGCCACAACAGTCTGAAATGGGAGCACCCTTTACACTAGAGATGTTGCAGAAGCCTAATAATTATGGTTTCTCAGGATATGCAAATTCAGGGGATTCATATGAAAACCAAGTTCAGGACAATAATGTGTTTTCGAGAACTAAGGACGAGCCTCGAGATGACTTGTTTATGGAGTCATTGCTTTGCTGAAACTGGAATCCTAGAAAGGAGCACGAATTGAAGTTTATGAAACGAAAAACTGAACCTTTTATTTATTTATTTTTGCATAAAGAATATGATAGGAAGCATTTTGATTTCATTTGTTAATAGATCATATACTGTTTTTTTTTTTGGTGTGTGTACATTTTGTACTAGGAAATTTGTTTGTTGTAAATTCAATCAAATGCGGTGTAGATGTTCATGCAGTTACCACTGTTATGGGGGTTATATAATTTAGGATAGGAATGTAAATCCCCAACTCATGACTATATGACACTGATTCTTTATTTCTATCACATTTTCAAGTTTTATATATTAAAGAAGATTGCAGTTTTTCAA
Protein sequence
>gi|460392301|ref|XP_004241755.1| PREDICTED: probable WRKY transcription factor 26 [Solanum lycopersicum]
MAASSFSFPTSSSSFMTTSFTDLLASDDYPTKGLADRIAERTGSGVPKFKSLPPPSLPLSPPPFSPSSYFAIPPGLSPTELLDSPVLLSSSNLLPSPTTGSFPSRAFNWKSSSHQDVKQEDKNYSDFSFQPQVGTAASSISQSQTNHVPLGQQAWNCQEPTKQNDQNANGRSEFNTVQNFMQNNNDQNNSGNQYNQSIREQKRSDDGYNWRKYGQKQVKGSENPRSYYKCTYPNCPTKKKVERSLDGQITEIVYKGNHNHPKPQSTRRSSSSTASSAFQSYNTQTNEIPDHQSYGSNGQMDSVATPENSSISFGDDDHEHTSQKSSRSRGDDLDEEEPDSKRWKRENESEGVSALGGSRTVREPRVVVQTTSDIDILDDGYRWRKYGQKVVKGNPNPRSYYKCTSTGCPVRKHVERASQDIRSVITTYEGKHNHDVPAARGSGNHSINRPMAPTIRPTVTSHQSNYQVPLQSIRPQQSEMGAPFTLEMLQKPNNYGFSGYANSGDSYENQVQDNNVFSRTKDEPRDDLFMESLLC
二.开放阅读框(ORF)的查找
开放阅读框(Open Reading Frame, ORF)是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。在没有其它信息的前提下,DNA序列可能按六种框架阅读和翻译(每条链三种,对应三种不同的起始位点)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一
2
[键入文字]
生物信息学结课论文
[键入文字]
的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。使用ORFfinder查找番茄WRKY26基因开放阅读框,这里使用默认参数,结果如图2.1所示。
图2.1WRKY26的ORF预测结果
结果表明:
如图2.1显示了ORF Finder 预测结果,给出了6个阅读框中可能的ORF图示、编码相位、位置及长度,这是根据六种不同的编码方式得到的(包括正反链)。从预测结果可以看出,一个DNA序列可能有多个ORF。相对而言,一段连续较长的ORF比较短的ORF更可能是编码序列。图中第三条(紫色标注)为该基因的开放阅读框,其从18号碱基到1625号碱基,长度为1608bp。在上述mRNA序列中使用灰色底纹标注出开放阅读框序列。
三.引物的设计
用Primer 5.0设计引物,根据实验需要(巢氏PCR),设计内侧引物和外侧引物。并且在内侧引物两端加入酶切位点,分别为XbaI ,SacI酶切位点。 表3.1引物序列 名称
SlWRKY31-F1
引物序列
CCCATTGCACTCTTGTATCTT TCAATTCGTGCTCCTTTCTAG
TCTAGAATGGCTGCTTCAAGTTTCTC (XbaI) GAGCTCTCAGCAAAGCAATGACTCC (SacI)
SlWRKY31-R1 SlWRKY31-F2 SlWRKY31-R2
图3.1外侧引物设计
3
[键入文字]
生物信息学结课论文
[键入文字]
图3.2 内侧引物设计
四.同源性比对
使用Blastn进行序列对比,选用RNA数据库,限定物种为番茄,其他参数默认,只有一条序列。
图4.1限定物种 Blast结果
条件改为不限定物种,其他参数默认
4