1. 重建祖先序列
- 根据现存物种的状态(性状/序列),以及系统发育关系,可以推断祖先节点物种的状态(性状/序列),即祖先状态重建。
- 这篇博客介绍使用PAML的baseML程序根据系统发育关系从现存物种的序列重建祖先序列的用法。
2. 用PAML的baseML程序重建祖先序列
2.1. 准备输入文件
输入的序列比对文件和树文件的格式可以参考https://github.com/abacus-gene/paml-tutorial/tree/main/positive-selection/00_data 中的 Mx_aln.phy Mx_root.tree,Mx_unroot.tre 文件。
- 序列比对文件 (cds_aln.phy)
- phylip格式
- 比对好的编码序列 (cds) 文件,碱基数量是3的倍数(codon模式比对)
- 建议删除gaps和难以align的区域,但要按密码子删除(删除和保留都是3的倍数个碱基)
- 树文件 (tree.newick)
- newick格式,并在首行前加上一行,包括两个数字,一个是物种/样本数量,一个是树的数量(一般是1),空格隔开。
- 只需要拓扑结构,删除枝长、支持率等信息。
- 配置文件 (baseml.ctl)
- baseml.ctl 的例子在安装的程序包paml/examples/下有,可以复制到分析目录下,修改后使用
- 基础的配置参数如下,后续分析可基于这套参数修改:
1 | seqfile = aln.phy * sequence data file name |
2.2. 执行
- 执行命令
baseml baseml.ctl
2.3. 结果文件
推断的祖先序列在结果文件rst中,与提供的比对好的现存物种序列长度一致,可免比对,直接提取使用。
2.3.1. out.txt
- 主要结果文件,默认名称是mlc。
- 内容包括每条序列的A/T/C/G的频率,一致性位点数量,成对遗传距离矩阵,Pairwise deletion matrix,带枝长的树,树节点和枝的编号,以及kappa值。
2.3.2. rst:包含三块内容
Marginal reconstruction和Joint reconstruction是两种祖先序列重构的算法。如果对所有分类单元的合集都感兴趣,用joint;如果对特定分类单元的祖先感兴趣,用marginal。
- 运行的参数以及树的信息
- 给系统发育树的每个node进行编号的信息,以及每个branch是哪两个node连接而成;
- Marginal reconstruction of ancestral sequences的结果
- Prob of best state at each node, listed by site. 分位点记录的每个node的序列和频率,以及重建的祖先序列的概率;
- Summary of changes along branches. 分branch记录突变的位点;
- List of extant and reconstructed sequences(现存node和祖先node的序列);
- Overall accuracy of the 91 ancestral sequences
- Counts of changes at sites. 分位点记录突变的计数;
- Joint reconstruction of ancestral sequences的结果
- Reconstruction (prob.), listed by pattern
- List of extant and reconstructed sequences(现存node和祖先node的序列);
2.3.3. 其他文件
另外还有一些其他结果文件,暂时还未用到。
- rst1
- lnf
- rub
3. reference
- PAML User Guide:https://github.com/abacus-gene/paml/blob/master/doc/pamlDOC.pdf
- PAML 中文用户手册:https://blog.sciencenet.cn/blog-3433349-1241310.html
- PAML开发者网站:http://abacus.gene.ucl.ac.uk/software/#phylogenetic-analysis-by-maximum-likelihood-paml
- paml软件进行祖先酶序列重建极简教程视频:https://www.bilibili.com/video/BV1AX4y1K7H4/
- 欢迎关注微信公众号:生信技工
- 公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容,包括生物信息学工具的基本原理、操作步骤和学习心得。