MEGA3 指南 联系客服

发布时间 : 星期二 文章MEGA3 指南更新完毕开始阅读91c75daeddccda38366bafb6

2005-9-24 6:58:00

Ex 5.1.2 :用鼠标右键点击目标数据域(Data domain),选择“Delete Gene/Domain” 删除 该域。

Ex 5.1.3:用鼠标右键点击“Names” 栏中的“Genes/Domains” 条目,添加新的域;用鼠标

右键点击新域,选择“Edit Name” ,并命名为“Exon1” 。

Ex 5.1.4:在“From” 列问号(?)标记处为该域设置第一个位点;在位点选择窗口中选 择1 号位点,点击“点击”按钮。

Ex 5.1.5:在“To” 列为该域设置最后一个位点;在位点选择窗口中选择3918 号位点,点 击“点击”按钮。

Ex 5.1.6:标记“Coding” 列的空白方框,表明该域编码蛋白。

Ex 5.1.7:添加另外两个Genes/Domains 条目;一个命名为“Intron1”,开始于3919 位点, 结束于5191 位点;另一个命名为“Exon2” ,开始于5192 位点,结束于8421 位点,并对该域

的“Coding” 进行标记。

Ex 5.1.8:右击“Genes/Domains” ,选择“Insert New Gene”。将新条目名称改为“Predicted Gene”;将所有域点击并拖动(click-and-drag )到该新基因下,使它们成为“Predicted Gene” 条目下的子项(children)。

Ex 5.1.9:点击“Close” 按钮,退出“Gene/Domain” 设定窗口。

现在我们就可以在计算配对(pairwise )距离时用这些域定义进行限制性分析了。

Ex 5.2.1:选择“Distances | Compute Pairwise” ,并确定状态为核苷模式(Nucleotide model)。

Ex 5.2.2:确定“Include Sites” 栏目下“Noncoding sites” 选项未选择。回到主菜单开始运算。

Ex 5.2.3 :运算完成后“Distance Explore” 将显示仅用“Predicted Gene” 中的外显子域 (exonic domains )数据获得的配对距离。

6. 正选择检验

在这一部分我们将以人的HLA-A 位点五个等位基因蛋白编码核苷序列为例(Nei and Hughes 1991) ,来呈现各种分析方法。

Ex 6.0.1:启动MEGA3。

Ex 6.1.1:在File 中(或用“Click me to active a data file” )激活HLA_3Seq.meg 文件。

Ex 6.1.2 :文件激活后,底部状态栏将显示文件的各种详细信息,主菜单栏上将显示更 多的功能菜单。

我们将通过比较同义和非同义距离,来研究这组抗原识别位点的正达尔文选择。

Ex 6.2.1 :选择“Selection | Codon-based Z-Test” ,在分析参考对话框的“Model” 下拉菜单

中选择“Syn-Nonsysnonymous | Nei-Gojobori Method | p-distance” ,在“Hypothesis to test” 下拉

菜单中选“Positive selection (dN > dS)”,在“Analysis Scope”下拉菜单中选择“Overall Average” ,在“Gaps/Missing Data”下拉菜单中选“Pairwise Deletion” ;设置完成后开始运算。

Ex 6.2.2:运算过程中将显示进程;结果在新窗口中显示。 Ex 6.2.3:“Prob” 栏为计算得到的概率(若要在5%水平上排除假设,该项值必须<0.05), “Stat” 栏为计算概率的统计值(statistic)。 Ex 6.2.4:退出MEGA。

7. 对类群分群

Ex 7.0.1:启动MEGA3。

Ex 7.0.2:在File 中(或用“Click me to active a data file” )激活Crab_rRNA.meg 文件。 下面我们将演示如何将类群化为不同的群。

Ex 7.1.2:选择“Data |Setup / Select Taxa & Groups” 。

Ex 7.1.3:点击对话框底部的“New Group” 按钮,添加一个新群,并命名为“Pagurus” 。 - 17 -

2005-9-24 6:58:00

Ex 7.1.4 :按住键盘上的“Ctrl”键,选择“Ungrouped Taxa” 栏目下所有Pagurus 物种;点

击中间框上的左向箭头指示(此时“Taxa/Groups” 栏中的新建群——即Pagurus——应该程序

选中状态),将所选类群添加到新建立的群中。

Ex 7.1.5 :选中“Taxa/Groups” 栏目下的“All” ,点击该栏目下的“New Group” 按钮来建立

第二个新群——“Non-Pagurus” ;将剩余所有类群添加到该新群中,点击“Close” 按钮。

Ex 7.1.6 :现在群已经建立,用户可以用“Distance” 菜单中的“Compute Within Group Mean” 、“Compute Between Group Means” 、“Compute Net Between Group Means” 等按钮分析 数据。

8. 核苷序列统计属性计算

在这一部分我们将演示如何利用“Data Explorer” 来计算核苷序列的各种统计量。此外, 我们还将介绍常用命令的快捷方法、获得在线帮助的方法、以及如何区分已激活的和未激活 的命令。

Ex 8.0.1:启动MEGA3。

下面我们将用内嵌的文本编辑(Text Editor )功能来检查Drosophila_Adh.meg 文件的内 容。

Ex 8.1.1 :激活“File” 菜单下的文本编辑器(text editor ),在文本编辑器中打开 Drosophila_Adh.meg 文件。

Ex 8.1.2:检查Drosophila_Adh.meg 文件中#mega format specifier 、title 、OTU 名和交叉 排列的序列数据。

Ex 8.1.3 :我们建议在进行数据分析之前应该退出文本编辑器。在关闭文本编辑器时, 若提示保存,则选“No” 。

下面我们将激活Drosophila_Adh.meg 文件,研究其统计属性。

Ex 8.2.1:在File 中(或用“Click me to active a data file” )激活Drosophila_Adh.meg 文件。

文件激活后,“Data” 、“Distances” 和“Tests” 等功能可用。下面我们将用“Data Explorer” 来计算一些基本统计数值。

Ex 8.3.1:选择“Data | Data Explorer” 。

Ex 8.3.2:“Data Explorer” 左下角显示光标位置信息。

Ex 8.3.3:在“Highlight | Variable Sites” 或工具栏可以对位点进行高亮(Highlight)标识。

Ex 8.3.4:选择“Statistics | Nucleotide Composition” 来计算核苷碱基频率,结果将在内嵌 的文本编辑器中显示。

Ex 8.3.5:选择“Statistics | Codon Usage” 来计算密码子使用,结果将在内嵌的文本编辑器 中显示。

Ex 8.3.6 :选择“Statistics | Nucleotide Pair Frequencies | Directional” 或“Statistics |

Nucleotide Pair Frequencies | Unidirectional” 可计算核苷配对频率,结果将在内嵌的文本编辑

器中显示。

Ex 8.3.8:选择“Data | Translate / Untranslate” 可实现氨基酸序列与核苷序列之间的相互转 换。

Ex 8.3.9:选择“Statistics | Amino Acid Composition” 可计算氨基酸组成。 Ex 8.3.10 :关闭MEGA。

9. 用距离数据构建系统树

在这一部分我们将演示在只读模式下打开文件,并用激活的距离数据构建系统树。 Ex 9.1.1:启动MEGA3。

在下面的例子中我们将使用Hum_Dist.meg 文件;我们会用内嵌的文本编辑器打开该文 件进行检查,但不进行编辑。

- 18 -

2005-9-24 6:58:00

Ex 9.2.1 :激活“File” 菜单下的文本编辑器(text editor ),在文本编辑器中打开 Hum_Dist.meg 文件。

Ex 9.2.2 :检查Hum_Dist.meg 文件中#mega format specifier 、title 、OTU 名和交叉排列 的序列数据。

Ex 9.2.3 :我们建议在进行数据分析之前应该退出文本编辑器。在关闭文本编辑器时, 若提示保存,则选“No” 。

下面我们将在MEGA 中激活Hum_Dist.meg 文件,并利用该距离数据构建系统树。

Ex 9.3.1:在File 中(或用“Click me to active a data file” )激活Hum_Dist.meg 文件。

Ex 9.3.2:在“Phylogeny” 中选择“Neighbor-joining” ,并开始运算。

Ex 9.3.3:生成的NJ 树将在“Tree Explorer” 中显示。

Ex 9.3.4:关闭数据,退出MEGA。 注:

hsp20.fas 用于演示对序列比对,Drosophila_Adh.meg 用于演示“由核苷序列估计演化距 离”、“核苷序列统计属性计算”,Crab_rRNA.meg 用于演示“系统树建立”、“对类群分群”, Chloroplast_Martin.meg 用于演示“检验获得的系统树的可靠性”,Contigs.meg 用于演示“基 因和域的操作和分析”,HLA_3Seq.meg 用于演示“正选择检验”,Hum_Dist.meg 用于演示 “用距离数据构建系统树”。

hsp20.fas 文件是一个含有四条序列的FASTA 序列文件。Drosophila_Adh.meg 是一个经 过比对的含有11 条编码DNA 序列的MEGA 文件,并进行了基因注释,序列以隔行形式排

列。Crab_rRNA.meg 是一个经过比对的含有13 条编码DNA 序列的MEGA 文件。

Chloroplast_Martin.meg 含有10 条经过比对的叶绿体蛋白质序列;每条序列均由多个蛋白质

序列组成,并进行了基因注释;序列以隔行形式排列。Contigs.meg 文件是一个含有两条经 过比对的蛋白编码DNA 序列的MEGA 文件。HLA_3Seq.meg 是一个进行了域注释和位点标

记的MEGA 文件,其中含有三条经过比对的编码DNA 序列。Hum_Dist.meg 是一个含有15

个类群的距离矩阵数据文件。

- 19 -