利用RAxML构建ML树

Published at 2020-04-19 15:08

Author:zhixy

View:901


RAxML

一下内容基于 RAxML v8.2

安装

推荐安装方式conda

[user@server ~]# conda install -c bioconda raxml

参数介绍

  • -s 输入序列比对文件(phylip格式)
  • -n 输出文件名(前缀)
  • -p 简约搜索的起始随机数
  • -b 自展检验重复次数
  • -x 指定一个整数(随机数)并启用快速bootstrapping
  • -T 设置线程数
  • -m model setting 模型选择

    RaxML针对核苷酸的替代模型只有GTR一种;而针对蛋白质的模型有27种。以蛋白质为例模型设置方法:-m PROTGAMMAImatrixName[F|X], 其中matrixName即进化模型的名称,如LGWAG等;F代表基于经验基础频率,X表示最大似然法估计的基础频率,二者选其一。

  • -f select algorithm 选择算法 -- -f a 快速自展分析。 -- -f n 计算树文件中包含的所有树的对数似然得分,通过-z导入树文件。模型参数只能预估树文件里第一棵树。想要将模型参数评估每棵树使用–f N。 -- -f r 计算一个树文件里所有树的成对碱基的RobinsonFoulds(RF)距离。 -- -f R 比较一棵大的参考树和许多小树之间的成对碱基的RobinsonFoulds(RF)距离。

以蛋白质序列为例

[user@server ~]# raxmlHPC-PTHREADS -x 12345 -p 12345 -N 100 -f a -m PROTGAMMAILGF -T 60 -s alignment.phy -n test

参考文献

  1. Stamatakis A. RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bioinformatics. 2014 May 1;30(9):1312-3. doi: 10.1093/bioinformatics/btu033.