生物信息学课程论文 doc 联系客服

发布时间 : 星期一 文章生物信息学课程论文 doc更新完毕开始阅读5c9f5d6419e8b8f67c1cb9ac

[键入文字]

生物信息学结课论文

[键入文字]

图4.2不限定物种Blast结果

图4.3不限定物种Blast结果

五.同源性分析

下载不同物种与番茄WRKY26的同源蛋白质序列,共计7条,使用MEGA5.1制作进化树。使用Pairwise blastp、emboss_needle、emboss_water程序比对上述氨基酸序列中的两条,其中均使用EBLOSUM62矩阵。

表5.1 蛋白质序列

名称

番茄(Solanum lycopersicum) 马铃薯(Solanum tuberosum) 烟草(Nicotiana sylvestris) 白梨(Pyrus x bretschneideri) 苹果(Malus domestica) 芝麻(Sesamum indicum) 甜菜(Beta vulgaris)

5

登录号

XP_004241755.1 NP_001274836.1 XP_009790461.1 XP_009372253.1 XP_008350560.1 XP_011095229.1 XP_010685944.1

[键入文字]

生物信息学结课论文

[键入文字]

表5.2氨基酸序列比对

程序

Pairwise blastp emboss_needle emboss_water

得分值

1074 2771.5 2771.5

一致性

522/537(97.0%) 522/537(97.2%) 522/537(97.2%)

相似性 空位

528/537(98.0%) 3/537(0%) 528/537(98.3%) 528/537(98.3%

3/537(0.6%) 3/537(0.6%)

99 Solanum lycopersicum1007341 Solanum tuberosum Nicotiana sylvestris Beta vulgaris subsp. vulgaris Malus domestica Sesamum indicum Pyrus x bretschneideri0.1

图5.1进化树

如图5.1所示:

1) 同属于茄科的马铃薯、番茄和烟草聚成一个亚类,这说明它们的亲缘关系很近,其中番茄和马铃薯的同源性极高。

2) 甜菜和番茄尽管在一个类群,但是甜菜在外侧,说明它们亲缘关系较远。 3) 从表5.2也可以看出番茄WRKY26基因编码的蛋白质和马铃薯STWRKY8基因编码的蛋白质的相似度非常高,说明两个基因的同源性很高,与进化树分析结果相同

六.蛋白质理化性质分析

使用ExPASy - ProtParam tool分析氨基酸序列。 表6.1氨基酸组成 氨基酸 数量 比例 氨基酸 数量 比例 Ala (A) 21 3.9% Arg (R) 30 5.6% Asn (N) 39 7.3% Asp (D) 33 6.2% Cys (C) 6 1.1% Gln (Q) 37 6.9% Glu (E) 26 4.9% Gly (G) 32 6.0% His (H) 12 2.2% Ile (I) 15 2.8% Leu (L) 24 4.5% Lys (K) 28 5.2% Met (M) 8 1.5% Phe (F) 19 3.6% Pro (P) 42 7.9% Ser (S) 78 14.6% Thr (T) 34 6.4% Trp (W) 5 0.9% Tyr (Y) 21 3.9% Val (V) 25 4.7% Pyl (O) 0 0.0% Sec (U) 0 0.0%

6

[键入文字]

生物信息学结课论文

[键入文字]

表6.1氨基酸序列ExPASy分析结果

名称 理论等 电点 数值 6.87 带正电 带负电 氨基酸 氨基酸 58 59 不稳定 系数 60.15 45.91 脂肪系数 总平均 疏水性 -1.062 C2562H3948N758O863S14 59624.9 化学式 分子量 结果分析: 1) 总的亲水性平均系数(GRAVY)为-1.062,由于总的亲水性平均系数可以体现蛋白质的亲疏水性质,数值越大代表亲水性越强,越低代表越弱。由于-1.062<0,,测该蛋白属于疏水性蛋白。

2) 由于该蛋白质带负电氨基多于带正电氨基酸,推测此蛋白质带负电。 3) 该蛋白质等电点为6.87,低于7.0,说明该蛋白质为酸性。

4) 该蛋白质不稳定系数为:60.15,其值大于40,表明这个分类的蛋白质不稳定。

七.蛋白质亲疏水性分析

蛋白质亲疏水性氨基酸的组成是蛋白质折叠的主要驱动力。一般通过亲水性

分布图反映蛋白质的折叠情况。使用ProtScale tool分析WRKY26所编码蛋白的亲疏水性。

图 7.1蛋白质的亲疏水性预测

结果表明:

根据氨基酸分值越低亲水性越强和分值越高的规律,如图7.1,该蛋白质位于第523位为S的氨基酸具有最小值为-3.244,亲水性最强;位于第90位为E的氨基酸有最大值为 1.500,其疏水性最强。而就整体而言,疏水性氨基酸均匀分布在整个肽链中且多于亲水性氨基酸。 因此,整个多肽链表现为疏水性,无明显的亲水区域,可认为WRKY26 基因编码的蛋白是疏水性蛋白。

7

[键入文字]

生物信息学结课论文

[键入文字]

八.信号肽的分析

信号肽位于蛋白质的 N 端,指导分泌性蛋白到内质网膜上合成,在蛋白质合成结束之前被切除,它一般有16-26个氨基酸残基,其中包括疏水核心区、 信号肽的C 端和 N 端。在靠近该序列N端常常有1个或数个带正电荷的氨基酸 在其C末端靠近蛋白酶切割位点处常常带有数个极性氨基酸,离切割位点最近的那个氨基酸往往带有很短的侧链。使用Signal IP 4.1severse预测信号肽。

C--剪切位点计分 S--信号肽计分 Y--综合计分

图8.1信号肽分析结果

注:

S值:一个氨基酸可以找到一个对应的S值,S值的变化趋势在结果显示的图表中有一个曲线可以表示,观察发现信号肽区域的S值相对较高。

C值:剪切位点值。每个氨基酸也会对应一个C值,C值最高在剪切位点处。 Y值:Y-max是一个参数,可以用来综合考虑S值和C值,这要比单一考虑S值要更为精准。因为在一条系列中剪切位点只有一个,而C值可能有不止一个此时的剪切位点就由Y-max值來推测的,为S值是睦峭的位置和高C值的位点的判断提供依据。

S平均值:是从端氨基酸开始到剪切位点处各氨基酸的平均值。

D值:S-mean和Y-max的平均值,对区分该蛋白是否具有分泌作用具有重要 作用。

表8.1信号肽分析结果

测量值

最大C值 最大Y值 最大S值

位置 数值

0.163 0.151 0.289

剪切

信号肽

36 11 5

8