进化树的Newick格式

Published at 2020-05-02 20:18

Author:zhixy

View:480


由来

1986年6月间,美国新罕布什尔州丹佛市召开了一次分子进化领域的学术会议。这次会议实际上由一系列非正式的讨论构成, 其中有有两次讨论就在Newick’s Lobster House的龙虾馆举行。七位学者(James Archie, William Day, Joe Felsenstein, Wayne Maddison, Christopher Meacham, F. James Rohlf, David Swofford)一边吃着美味的龙虾,一边讨论着分子进化领域的科学问题。 这次讨论的结果对整个系统发育学(phylogenetics)产生了重要的影响。因为正是在这次会议中诞生了一种全新的、 用字符与括号来对进化树进行描述的格式。也许是龙虾鲜美令人难以忘怀的缘故,大家决定用 Newick龙虾馆来命名这种格式。

Newick的诞生一年后,就有了竞争对手Nexus

解释

newick example

上图中的进化树用newick格式表达,即:

(A,(B,(C,D)));

两个共享最近祖先的物种,即此例中的CD,由逗号分隔后,放入一组小括号内;CD的祖先节点,又与B共享了一个最近祖先, 由(C,D)代表的祖先节点与B由逗号分隔后,放入一组小括号内;以此类推。

需要指出的是,以下三种方式:(A,(B,(C,D)));(A,(B,(D,C)));(A,((C,D),B));,都可以表示这棵树。

newick以;号结束,同一文件里可存放多个newick格式树。

在树的外节点(树枝的终端)和内节点(如(C,D))后,通过:号引入枝长的取值,得:

(A:0.6,(B:0.1,(C:0.1,D:0.1):0.2):0.1):0.1;

图形效果如下:

newick example2

在枝长的:号前,内节点的右括号后,可插入对分枝的注释信息,如Bootstrap值等

(A:0.6,(B:0.1,(C:0.1,D:0.1)97:0.2)90:0.1):0.1;

图形效果如下:

newick example3

小结

Newick格式,结构简单,便于理解,程序解析也很简便,是学习分子进化的重要知识点。