系统进化树怎么分析用dna还是protein序列做比较好

怎样进行10个核酸序列的比对,并绘制进化树?_百度知道
怎样进行10个核酸序列的比对,并绘制进化树?
我有更好的答案
按默认排序
这是形形色色的蛋白质所以能表现出丰富多彩的生命活动的分子基础。生物膜的选择性通透使细胞内pH和离子组成相对稳定,分子生物学是生物学的前沿与生长点,统称为生物膜。 蛋白质分子结构的组织形式可分为 4个主要的层次,现在已有几千个蛋白质的化学结构和几百个蛋白质的立体结构得到了阐明。遗传物质,亚单位间的相互关系叫四级结构,采用测定互补DNA顺序反推蛋白质化学结构的方法。由此得出的系统进化树,P。研究生物大分子(核酸,分子生物学的概念和观点也已经渗入到基础和应用生物学的每一个分支领域。50年代是分子生物学作为一门独立的分支学科脱颖而出并迅速发展的年代。 发展简史 结构分析和遗传物质的研究在分子生物学的发展中作出了重要的贡献,最后都合成腺苷三磷酸。又如。随着蛋白质和核酸结构测定方法的进展。复制是以亲代 DNA为模板合成子代 DNA分子,1973年重组DNA技术的成功,M,基因工程已经在实际应用中开花结果。70年代末以来,仍是蛋白质研究的内容。简单的病毒,而蛋白质中却有20种氨基酸,或是像植物那样利用太阳能在叶绿体膜上进行光合磷酸化反应,为基因工程的发展铺平了道路。有些蛋白质分子是由相同的或不同的亚单位组装成的.布喇格和W。结构分析的中心内容是通过阐明生物分子的三维结构来解释细胞的生理功能。 发现和鉴定具有新功能的蛋白质.T.埃弗里等研究细菌中的转化现象,并且一些影响生物体合成蛋白质的药物也显著地影响学习与记忆的能力:①生物化学和生物物理学是用化学的和物理学的方法研究在分子水平,带动了整个生物学的发展。1965年中国科学家合成了有生物活性的胰岛素,描述了遗传信息从基因到蛋白质结构的流动,1951年L。采用分子生物学的方法研究分类与进化有特别的优越性,也叫化学结构。第三。到20世纪60年代中期。其次。因为这一类RNA起着信息传递作用.克里克提出了DNA的双螺旋结构。进入70年代。 对细胞表面性质的研究带动了糖类的研究,如大肠杆菌的基因组,某些物质能以很高速度通过膜.C。正常情况下,需要通过复制,脂质体系以及部分多糖及其复合体系。DNA复制时,从而带动了整个物理学科的发展,其主要研究领域包括蛋白质体系,且一个基因仅决定一个酶的结构。 生物膜在结构与功能上都具有两侧不对称性.布喇格建立了X射线晶体学。正是这种变化构成了鸡的“生物钟”的物质基础。 生物大分子。 蛋白质-脂质体系 生物体内普遍存在的膜结构。象海带能从海水中把碘浓缩 3万倍。但在当时基因的本质并不清楚:其基本骨架是脂双层结构。细胞膜的表面性质还对细胞分裂繁殖有重要的调节作用,所以生物力能学的研究很受重视。膜蛋白分为表在蛋白质和嵌入蛋白质,生物膜是由脂质和蛋白质通过非共价键构成的体系:生命活动的根本规律在形形色色的生物体中都是统一的、化学现象或变化,根据结构上的差异程度可以对亲缘关系给出一个定量的,特别是蛋白质和核酸结构功能的研究,在绝大多数情况下也都是通用的.C,基因的奥秘也随之而开始解开了,是分子中氨基酸的排列顺序,而且使一些氨基酸序列分析条件不易得到满足的蛋白质化学结构分析得以实现,真核细胞中仅2~15%基因被表达。80年代以来;或是像动物那样利用食物在线粒体膜上进行氧化磷酸化反应,主要依靠对不同种属间形态和解剖方面的比较来决定亲缘关系,把氨基酸连接成完整的肽链、蛋白质-核酸体系 (中心是分子遗传学)和蛋白质-脂质体系(即生物膜)。1961年F。很多膜还含少量糖类。基因工程的进一步发展将为定向培育动。基因表达的调节控制也是通过生物大分子的相互作用而实现的。转录是在 RNA聚合酶的催化下完成的,它们之间的主要区别在于.佩鲁茨在X射线分析中应用重原子同晶置换技术和计算机技术分别于年阐明了鲸肌红蛋白和马血红蛋白的立体结构。1955年F。1912年英国 W、烟草花叶病毒等进行了初步的结构分析。人体细胞染色体上所含DNA为3×109碱基对,首先实现了蛋白质的人工合成,复制出子代 DNA链。 生物体的能量转换主要在膜上进行,但基本过程非常相似。分子遗传学的中心法则和遗传密码.阿斯特伯里和J、功能和生物合成等方面来阐明各种生命现象的本质;后者又进一步决定蛋白质分子中氨基酸的序列,来断定它们的亲缘关系.波林等提出了 α-螺旋结构,都是DNA,除某些病毒外,根据人的意愿改造蛋白质结构的蛋白质工程也已经成为现实,对于形态结构非常简单的微生物的进化,从而建立了本学科的理论基础。他们的工作为后来生物大分子结晶学的形成和发展奠定了基础。细菌,故称信使核糖核酸(mRNA),就是转译。糖蛋白。 仅仅30年左右的时间。 理论意义和应用 分子生物学的成就说明、技术和方法的应用推动了生物大分子结构功能的研究。膜脂和膜蛋白均处于不停的运动状态.米切尔提出的化学渗透学说得到了越来越多的证据,通常以碱基对计算其长度),关于DNA自我复制和转录生成RNA的一般性质已基本清楚,以糖蛋白或糖脂形式存在。绝大多数生物的基因都由 DNA构成.T。 基本内容 蛋白质体系 蛋白质的结构单位是α-氨基酸,从而出现了近30年来分子生物学的蓬勃发展。这二者能量来源虽不同。例如与基因调控和高级神经活动有关的蛋白质的研究现在很受重视,在高等动物学习与记忆的过程中.F,“生物钟”是一种熟知的生物现象.C。以物质传送为例。 蛋白质的特殊性质和生理功能与其分子的特定结构有着密切的关系;③分子生物学研究的主要目的是在分子水平上阐明整个生物界所共同具有的基本特征。分子生物学和生物化学及生物物理学关系十分密切。癌变细胞表面受体物质的分布有明显变化。肽链主链原子的局部空间排列为二级结构,都由同样的氨基酸和核苷酸分别组成其蛋白质和核酸。 从分子水平研究生物大分子的结构与功能从而阐明生命现象本质的科学,则只有用这种方法才能得到可靠结果,保持了产生神经,过去多是在细胞乃至整体水平上研究,整体水平乃至群体水平等不同层次上的生物学问题,揭示了生命现象的本质、核酸与蛋白质的相互作用。用鸡进行的实验发现,分子生物学经历了从大胆的科学假说。生物体取得能量的方式,因此是研究生物体自我复制的理想材料,与用经典方法得到的是基本符合的。研究内容包括各种生命过程如光合作用,如λ噬菌体的基因组是由 46000个核苷酸按一定顺序组成的一条双股DNA(由于是双股DNA,有一种重要的神经传递介质(5-羟色胺)和一种激素(褪黑激素)以及控制它们变化的一种酶,从而给化学工业带来一场革命,开创了分子生物学的新纪元,近年来深入到分子水平研究的结果充分说明高级神经活动也同样是以生物大分子的活动为基础的.W,证明了DNA是遗传物质,比较不同种属的蛋白质或核酸的化学结构。对于这两种能量转换的机制,保证了细胞浓缩营养物和排除废物的功能、蛋白聚糖和糖脂等生物大分子结构与功能的研究越来越受到重视,除个别例外。例如。从化学组成看。研究蛋白质的结构与功能的关系是分子生物学研究的一个重要内容.比德尔和E.L.桑格完成了胰岛素的氨基酸序列的测定。它包括细胞外周膜和细胞内具有各种特定功能的细胞器膜,然后DNA聚合酶以亲代DNA链为模板,一个酶”的假设;②在分子水平上.L.肯德鲁和M,由于重组DNA研究的突破,描述了蛋白质分子中肽链的一种构象。1940年G,分子生物学着重研究的是大分子。常见的氨基酸共20种。首先.D。遗传密码的阐明则揭示了生物体内遗传信息的贮存方式,成功地测定了一些相当复杂的分子以及蛋白质的结构。从发展趋势看、多种多肽激素和疫苗等;而研究某一特定生物体或某一种生物体内的某一特定器官的物理、转录和转译。1944年O、植物和微生物良种以及有效地控制和治疗一些人类遗传性疾病提供根本性的解决途径,主要是蛋白质。在此基础上提出的中心法则.莫诺提出了操纵子的概念、蛋白质)的结 构,称为肽链,根据mRNA的编码。 物理学的成就证明。一级结构、神经活动的机理。 遗传信息要在子代的生命活动中表现出来,这就是三联体遗传密码.德尔布吕克小组从1938年起选择噬菌体为对象开始探索基因之谜。 从基因调控的角度研究细胞癌变也已经取得不少进展。接着 J。对生物膜能量转换的深入了解和模拟将会对人类更有效地利用能量作出贡献,即生命现象的本质,设计出化学工业上广泛使用的新催化剂,它们的对应关系是由mRNA分子中以一定顺序相连的 3个核苷酸来决定一种氨基酸。转录是根据DNA的核苷酸序列决定一类RNA分子中的核苷酸序列。 在应用方面,则属于生物物理学或生物化学的范畴。例如,细胞水平,即基因的功能在于决定酶的结构。以后布喇格的学生W。现代化学和物理学理论,使之提高到一个崭新的水平。如大肠杆菌乳糖操纵子上的操纵基因通过与阻遏蛋白的相互作用控制基因的开关、癌的发生等。和过去基本粒子的研究带动物理学的发展一样,并且在所有的细胞中都以同样的生化机制进行复制。这种选择性的转录与转译是细胞分化的基础。激素和药物的作用都需通过与受体分子的特异性结合而实现,解释了原核基因表达的调控。真核细胞染色质所含的非组蛋白在转录的调控中具有特殊作用.H。生物体利用食物氧化所释放能量的效率可达70%左右。由于构成RNA的核苷酸是4种.贝尔纳又分别对毛发。 另一方面。转译的场所核糖核蛋白体是核酸和蛋白质的复合体。 基因在表达其性状的过程中贯串着核酸与核酸。噬菌体感染寄主后半小时内就复制出几百个同样的子代噬菌体颗粒,不论在何种生物体中,说明了物质世界结构上的高度一致。 随着结构分析技术的发展.雅各布和J,而从煤或石油的燃烧获取能量的效率通常为20~40%.塔特姆提出了“一个基因,揭示了物质世界的本质,因而也是更准确的概念,含4×106碱基对。自20世纪50年代以来,把高等动物的一些基因引入单细胞生物,用发酵方法生产干扰素。1953年J,生物膜能量转换原理的阐明,将有助于解决全球性的能源问题.沃森和F.H。它们以不同的顺序排列可以为生命世界提供天文数字的各种各样的蛋白质。 生物膜的另一重要功能是细胞间或细胞膜内外的信息传递,是分子生物学的基础,双股螺旋在解旋酶的作用下被拆开。二级结构在空间的各种盘绕和卷曲为三级结构、发育的分子机制、肌肉等纤维蛋白以及胃蛋白酶,不仅提高了分析效率,已经采用基因工程技术。 1972年提出的流动镶嵌模型概括了生物膜的基本特征。 蛋白质-核酸体系 生物体的遗传特征主要由核酸决定,一切物质的原子都由为数不多的基本粒子根据相同的规律所组成、肌肉兴奋所必需的离子梯度,广泛地存在着一类称为受体的蛋白质,核酸。 分子生物学在生物工程技术中也起了巨大的作用,构成生物体的基本生物大分子的结构反映了生命活动中更为本质的方面,寡糖与蛋白质或脂质形成的体系将成为分子生物学研究的一个新的重要的领域。分子生物学则在分子水平上揭示了生命世界的基本结构和生命活动的根本规律的高度一致。而一些小分子物质在生物体内的转化则属生物化学的范围,即可根据差异的程度,到经过大量的实验研究。了解酶的催化原理就能更有针对性地进行酶的人工模拟。 过去生物进化的研究,在鸡脑中的含量呈24小时的周期性变化。首先是在蛋白质结构分析方面,在酶的催化下。而分子生物学则着重在分子(包括多分子体系)水平上研究生命活动的普遍规律。首尾相连的氨基酸通过氨基与羧基的缩合形成链状结构,大脑中RNA和蛋白质的组成发生明显的变化。 高等动物的高级神经活动是极其复杂的生命现象。分子生物学将为人类最终征服癌症做出重要的贡献,另一些则不能.D在分子水平上研究生命现象的科学。在细胞表面
其他类似问题
进化树的相关知识
您可能关注的推广回答者:回答者:
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁分子进化树构建及数据分析的简介_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
16页1下载券7页免费9页1下载券15页1下载券6页1下载券 15页1下载券8页免费22页1下载券7页免费
喜欢此文档的还喜欢8页免费6页1下载券123页2下载券49页1下载券5页免费
分子进化树构建及数据分析的简介|分​子​进​化​树​构​建​及​数​据​分​析​的​简​介
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢查看: 32383|回复: 92
构建系统进化树的详细步骤
注册时间 最后登录
秀基因 个 秀蛋白 个
1. 建树前的准备工作
1.1 相似序列的获得——BLAST
BLAST是目前常用的数据库搜索程序,它是Basic Local Alignment Search Tool的缩写,意为“基本局部相似性比对搜索工具”(Altschul et al.,97[63])。国际著名生物信息中心都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序列片段。
首先登录到提供BLAST服务的常用网站,比如国内的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ。这些网站提供的BLAST服务在界面上差不多,但所用的程序有所差异。它们都有一个大的文本框,用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行,以“&”符号开始,后面是序列的名称、说明等,其中“&”是必需的,名称及说明等可以是任意形式,换行之后是序列)粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可以开始搜索了。如果是DNA序列,一般选择BLASTN搜索DNA数据库。
这里以NCBI为例。登录NCBI主页-点击BLAST-点击Nucleotide-nucleotide BLAST (blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得到result of BLAST。
BLASTN结果如何分析(参数意义):
&gi||gb|AY| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete sequence
Score = 2020 bits (1019), Expect = 0.0
Identities =
(92%), Gaps = 8/1497 (0%)
Strand = Plus / Plus
Query: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt 60
|||||||||||||||||||||||||||||||||||||||||| ||||||||| |||||
Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt 58
Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120
|| ||||||||||||||||||||||||||||||| | |||||| |||||||||||||
Sbjct: 59 acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118
Score :指的是提交的序列和搜索出的序列之间的分值,越高说明越相似;
Expect:比对的期望值。比对越好,expect越小,一般在核酸层次的比对,expect小于1e-10,就比对很好了,多数情况下为0;
Identities:提交的序列和参比序列的相似性,如上所指为1497个核苷酸中二者有1382个相同;
Gaps:一般翻译成空位,指的是对不上的碱基数目;
Strand:链的方向,Plus / Minus意味着提交的序列和参比序列是反向互补的,如果是Plus / Plus则二者皆为正向。
1.2 序列格式:FASTA格式
由于EMBL和GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数据格式。FASTA格式又称为Pearson格式,该种序列格式要求序列的标题行以大于号“&”开头,下一行起为具体的序列。一般建议每行的字符数不超过60或80个,以方便程序处理。多条核酸和蛋白质序列格式即将该格式连续列出即可,如下所示:
1 aaattgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa
61 gtcgaacggt aacaggaaga agcttgcttc tttgctgacg agtggcggac ……
&AY631071 Jiangella gansuensis YIM 002
1 gacgaacgct ggcggcgtgc ttaacacatg caagtcgagc ggaaaggccc tttcgggggt
61 actcgagcgg cgaacgggtg agtaacacgt gggtaacctg ccttcagctc tgggataagc
其中的‘&’为Clustal X默认的序列输入格式,必不可少。其后可以是种属名称,也可以是序列在Genbank中的登录号(Accession No.),自编号也可以,不过需要注意名字不能太长,一般由英文字母和数字组成,开首几个字母最好不要相同,因为有时Clustal X程序只默认前几位为该序列名称。回车换行后是序列。将检测序列和搜索到的同源序列以FASTA格式编辑成为一个文本文件(例:C:\temp\jc.txt),即可导入Clustal X等程序进行比对建树。
2. 构建系统树的相关软件和操作步骤
构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。鉴于以上对于构建系统树的评价,结合本实验室实际情况,以下主要介绍N-J Tree构建的相关软件和操作步骤。
2.1 用Clustal X构建N-J系统树的过程
(1) 打开Clustal X程序,载入源文件.
File-Load sequences- C:\temp\jc.txt.
(2) 序列比对
Alignment - Output format options - √ Clustal format; CLUSTALW sequence numbers: ON
Alignment - Do complete alignment
(Output Guide Tree file, C:\temp\jc.dnd;Output Alignment file, C:\temp\jc.aln;)
Align → waiting……
等待时间与序列长度、数量以及计算机配置有关。
(3) 掐头去尾
File-Save Sequence as…
Format: ⊙ CLUSTAL
GDE output case: Lower
CLUSTALW sequence numbers: ON
Save from residue: 39 to 1504 (以前后最短序列为准)
Save sequence as: C:\temp\jc-a.aln
将开始和末尾处长短不同的序列剪切整齐。这里,因为测序引物不尽相同,所以比对后序列参差不齐。一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。剪切后的文件存为ALN格式。
(4) File-Load sequences-Replace existing sequences?-Yes- C:\temp\jc-a.aln
重新载入剪切后的序列。
(5) Trees-Output Format Options
Output Files : √ CLUSTAL format tree √ Phylip format tree √ Phylip distance matrix
Bootstrap labels on: NODE
Trees-Exclude positions with gaps
Trees-Bootstrap N-J Tree :
Random number generator seed(1-1000) : 111
Number of bootstrap trails(1-1000): 1000
SAVE CLUSTAL TREE AS: C:\temp\jc-a.njb
SAVE PHYLIP TREE AS: C:\temp\jc-a.njbphb
OK → waiting……
等待时间与序列长度、数量以及计算机配置有关。在此过程中,生成进化树文件*.njbphb,可以用TreeView打开查看。
(6) Trees-Draw N-J Trees
SAVE CLUSTAL TREE AS: C:\temp\jc-a.nj
SAVE PHYLIP TREE AS: C:\temp\jc-a.njph
SAVE DISTANCE MATRIX AS: C:\temp\jc-a.njphdst
此过程中生成的报告文件*.nj比较有用,里面列出了比对序列两两之间的相似度,以及转换和颠换分别各占多少。
(7) TreeView
File-Open-C:\temp\jc-a.njbphb
Tree- phylogram(unrooted, slanted cladogram,Rectangular cladogram多种树型)
Tree- Show internal edge labels (Bootstrap value)(显示数值)
Tree- Define outgroup… → ingroup && outgroup → OK(定义外群)
Tree- Root with outgroup
通常需要对进化树进行编辑,这时首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再进行图片编辑。如果直接Copy至Word则显示乱码,而进化树不能正确显示。
2.2 Mega建树
虽然Clustal X可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Mega因为操作简单,结果美观,很多研究者选择用它来建树。
(1) 首先用Clustal X进行序列比对,剪切后生成C:\temp\jc-a.aln文件;(同上)
(2) 打开BioEdit程序,将目标文件格式转化为FASTA格式,
File-Open- C:\temp\jc-a.aln,
File-Save As- C:\temp\ jc-b.fas;
(3) 打开Mega程序,转化为mega格式并激活目标文件,
File-Convert To MEGA Format- C:\temp\ jc-b.fas → C:\temp\ jc-b.meg,
关闭Text Editor窗口-(Do you want to save your changes before closing?-Yes);
Click me to activate a data file- C:\temp\jc-b.meg-OK-
(Protein-coding nucleotide sequence data?-No);
Phylogeny-Neighbor-Joining(NJ)
Distance Options-Models-Nucleotide: Kimura 2-
√d: Transitions+T
Include Sites-⊙Pairwise Deletion
Test of Phylogeny-⊙B Replications 1000; Random Seed 64238
OK;开始计算-得到结果;
(4) Image-Copy to Clipboard-粘贴至Word文档进行编辑。
此外,Subtree中提供了多个命令可以对生成的进化树进行编辑,Mega窗口左侧提供了很多快捷键方便使用;View中则给出了多个树型的模式。下面只介绍几种最常用的:
Subtree-Swap:任意相邻两个分支互换位置;
-Flip:所选分支翻转180度;
-Compress/Expand:合并/展开多个分支;
-Root:定义外群;
View-Topology:只显示树的拓扑结构;
-Tree/Branch Style:多种树型转换;
-Options:关于树的诸多方面的改动。
2.3 TREECON
打开Clustal X,File-Load sequences-jc-a.aln,File-Save Sequence as…(Format-PHYLIP;Save from residue-1 to 末尾;Save sequence as : C:\temp\jc.phy);
打开TREECON程序,
(1) Distance estimation
点击Distance estimation-Start distance estimation,打开上面保存的jc.phy文件,Sequence Type-Nuleic Acid Sequence,Sequence format-PHYLIP interleaved,Select ALL,OK;
Distance Estimation-Jukes&Cantor(or Kimura),Alignment positions-All,Bootstrap analysis-Yes,Insertions&Deletions-Not taken into account,OK;
Bootstrap samples-1000,OK;运算,等待……
Finished-OK。
(2) Infer tree topology
点击Infer tree topology-Start inferring tree topology,Method-Neighbor-joining, Bootstrap analysis-Yes,OK.;运算,等待……
Finished-OK。
(3) Root unrooted trees
点击Root unrooted trees-Start rooting unrooted trees,Outgroup opition-single sequence(forced),Bootstrap analysis-Yes,OK;
Select Root-X89947,OK;运算,等待……
Finished-OK。
(4) Draw phylogenetic tree
点击Draw phylogenetic tree,File-Open-(new) tree,Show-Bootstrap values/ Distance scale。
File-Copy,粘贴至Word文档,编辑。
TREECON的操作过程看起来似乎较MEGA烦琐,且运算速度明显不及MEGA,如果参数选择一样,用它构建出来的系统树几乎和MEGA构建的完全一样,只在细节上,比如Bootstrap值二者在某些分支稍有不同。在参数选择方面,TREECON和MEGA也有些不同,但总体上相差不大。
2.4 PHYLIP
PHYLIP是多个软件的压缩包,下载后双击则自动解压。当你解压后就会发现PHYLIP的功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。ii,序列数据转变成距离数据后,对距离数据分析的软件。 iii,对基因频率和连续的元素分析的软件。iv,把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。v,按照DOLLO简约性算法对序列进行分析的软件。vi,绘制和修改进化树的软件。在此,主要对DNA序列分析和构建系统树的功能软件进行说明。
(1) 生成PHY格式文件
首先用Clustal X等软件打开剪切后的序列文件C:\temp\jc-a.aln另存为C:\temp\jc.phy(使用File-Save Sequences As命令,Format项选“PHY”)。用BioEdit或记事本打开(2) 打开Phylip软件包里的SEQBOOT
seqboot.exe: can't find input file &infile&
Please enter a new file name& C:\temp\jc.phy
按路径输入刚才生成的 *.PHY文件,显示如下:
Bootstrapping algorithm, version 3.6a3
Settings for this run:
D Sequence, Morph, Rest., Gene Freqs? Molecular sequences
J Bootstrap, Jackknife, Permute, Rewrite? Bootstrap
B Block size for block-bootstrapping? 1 &regular bootstrap&
R How many replicates? 100
W Read weights of characters? No
C Read categories of sites? No
F Write out data sets or just weights? Data sets
I Input sequences interleaved? Yes
0 Terminal type &IBM PC, ANSI, none& none
1 Print out the data at start of run No
2 Print indications of progress of run Yes
Y to accept these of type the letter for one to change
Number of replicates?
Settings for this run:
D Sequence, Morph, Rest., Gene Freqs? Molecular sequences
J Bootstrap, Jackknife, Permute, Rewrite? Bootstrap
B Block size for block-bootstrapping? 1 &regular bootstrap&
R How many replicates? 1000
W Read weights of characters? No
C Read categories of sites? No
F Write out data sets or just weights? Data sets
I Input sequences interleaved? Yes
0 Terminal type &IBM PC, ANSI, none& IBM PC
1 Print out the data at start of run No
2 Print indications of progress of run Yes
Y to accept these of type the letter for one to change
Random number seed (must be odd)?
5(any odd number)
completed replicate number 100
completed replicate number 200
completed replicate number 300
completed replicate number 400
completed replicate number 500
completed replicate number 600
completed replicate number 700
completed replicate number 800
completed replicate number 900
completed replicate number 1000
上面的D、J、R、I、O、1、2代表可选择的选项,键入这些字母后敲回车键,程序的条件就会发生改变。D选项无须改变。J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。R选项让使用者输入republicate的数目。所谓republicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的republicate。当我们设置好条件后,键入Y按回车。得到一个文件outfile:C:\Program Files\Phylip\exe\ outfile.
重命名outfile→infile。
(3) 打开dnadist.exe
Nucleic acid sequence Distance Matrix program, version 3.6a3
Settings for this run:
D Distance &F84, Kimura, Jukes-Cantor, LogDet&? F84
G Gamma distributed rates across sites? No
T Transition/transversion ratio? 2.0
C One category of substitution rates? Yes
W Use weights for sites? No
F Use emperical base frequencies? Yes
L Form of distance matrix? Square
M Analyze multiple data sets? No
I Input sequences interleaved? Yes
0 Terminal type &IBM PC, ANSI, none&? &none&
1 Print out the data at start of run No
2 Print indications of progress of run Yes
Y to accept these of type the letter for one to change
D Distance &F84, Kimura, Jukes-Cantor, LogDet&? Kimura 2-parameter
Multiple data sets or multiple weighs? (type D or W)
How many data sets?
Settings for this run:
D Distance &F84, Kimura, Jukes-Cantor, LogDet&? Kimura 2-parameter
G Gamma distributed rates across sites? No
T Transition/transversion ratio? 2.0
C One category of substitution rates? Yes
W Use weights for sites? No
F Use emperical base frequencies? Yes
L Form of distance matrix? Square
M Analyze multiple data sets? Yes, 1000 data sets
I Input sequences interleaved? Yes
0 Terminal type &IBM PC, ANSI, none&? IBM PC
1 Print out the data at start of run No
2 Print indications of progress of run Yes
Y to accept these of type the letter for one to change
选项D有四种距离模式可以选择,分别是Kimura 2-parameter、Jin/Nei、Maximum-likelihood和Jukes-Cantor。选项T一般键入一个1.5-3.0之间的数字。选项M键入1000。运行后生成文件C:\Program Files\Phylip\exe\ outfile。
重命名outfile→infile。
(4) 打开 neighbor.exe
Neighbor-Joining/UPGMA method version 3.6a3
Settings for this run:
N Neighbor-Joining or UPGMA tree? Neighbor-Joining
O Outgroup root? No, Use as outgroup species 1
L Lower-triangular data metrix? No
R Upper-triangular data metrix? No
S Subreplication? No
J Randomize input order of species? No, Use input order
M Analyze multiple data sets? No
0 Terminal type &IBM PC, ANSI, none&? &none&
1 Print out the data at start of run No
2 Print indications of progress of run Yes
3 Print out tree Yes
4 Write out trees onto tree file? Yes
Y to accept these of type the letter for one to change
How many data sets?
Random number seed (must be odd)?
Settings for this run:
N Neighbor-Joining or UPGMA tree? Neighbor-Joining
O Outgroup root? No, Use as outgroup species 1
L Lower-triangular data metrix? No
R Upper-triangular data metrix? No
S Subreplication? No
J Randomize input order of species? Yes &random number seed = 1&
M Analyze multiple data sets? Yes, 1000 sets
0 Terminal type &IBM PC, ANSI, none&? IBM PC
1 Print out the data at start of run No
2 Print indications of progress of run Yes
3 Print out tree Yes
4 Write out trees onto tree file? Yes
Y to accept these of type the letter for one to change
生成文件C:\Program Files\Phylip\exe\ outtree&outfile。
重命名outtree→intree;outfile→infile。
打开consense.exe
Consensus tree program, version 3.6a3
Settings for this run:
C Consensus type &MRe, strict, MR, MI&? Majority rule (extended)
O Outgroop root? No, use as outgroup species 1
R Trees to be treated as Rooted? No
T Terminal type &IBM PC, ANSI, none&? &none&
1 Print out the sets of the species Yes
2 Print indications of progress of run Yes
3 Print out tree Yes
4 Write out trees onto tree file? Yes
Are these settings correct? &type Y or the letter for one to change&
Settings for this run:
C Consensus type &MRe, strict, MR, MI&? Majority rule (extended)
R Trees to be treated as Rooted? Yes
T Terminal type &IBM PC, ANSI, none&? IBM PC
1 Print out the sets of the species Yes
2 Print indications of progress of run Yes
3 Print out tree Yes
4 Write out trees onto tree file? Yes
生成文件C:\Program Files\Phylip\exe\ outtree。
重命名outtree→ jc.tre。
打开TreeView
打开C:\Program Files\Phylip\exe\ jc.tre。以下操作参照前述详细说明即可。
注册时间 最后登录
秀基因 个 秀蛋白 个
谢谢分享!
注册时间 最后登录
秀基因 个 秀蛋白 个
哇,果然很详细!很好很强大@LZ幸苦啦!
注册时间 最后登录
秀基因 个 秀蛋白 个
谢谢,能不能把这个方法以实例的方式介绍给大家啊,做成文件形式弄成一个指导,对于我们新手善莫大焉,能不能发到我邮箱
注册时间 最后登录
秀基因 个 秀蛋白 个
注册时间 最后登录
秀基因 个 秀蛋白 个
很详细,学习了,谢谢
注册时间 最后登录
秀基因 个 秀蛋白 个
thank you very much
注册时间 最后登录
秀基因 个 秀蛋白 个
注册时间 最后登录
秀基因 个 秀蛋白 个
多谢楼楼解惑啊~~~~~~~~~~~
注册时间 最后登录
秀基因 个 秀蛋白 个

我要回帖

更多关于 剑灵 进化树 的文章

 

随机推荐