ggtree实现系统发育树可视化

背景1:Newick格式

Newick是最常用的存储进化树的文件格式,如上面这个树,拓朴结构用newick格式可以表示为:

(B,(A,C,E),D);

括号最外层是根节点,它有三个子节点,B, (A,C,E)和D,而节点(A,C,E)也有三个子节点A,C和E。

加上分支长度,使用 : 来分隔:

(B:6.0,(A:5.0,C:3.0,E:4.0):5.0,D:11.0);

比如A:5.0代表的是A与其父节点的距离是5.0。

内部节点也可以有label,写在相应的括号外面,如下所示:

(B:6.0,(A:5.0,C:3.0,E:4.0)Ancestor1:5.0,D:11.0);

这是最为广泛支持的文件格式,很多进化树可视软件只支持newick格式。

背景2: 如何判断无根树有根树?

假设有下面三种形式的进化树:

[1] (a, b, c);      无根树

[2] (a, b, c):1;  有根树

[3] ((a,b),c);      有根树

如果最外层大括号内只有两个分枝,即为有根树,如[3];

如果最外层大括号内有三个或以上分枝,一般为无根树,如[1];

但是,如果大括号外存在枝长参数,如[2]中的:1,这种情况认为三个分枝以一定的枝长连接到根上,为有根树

ggtree使用

ggtree只映射节点到坐标系统中,而线条在geom_tree图层中计算并画出来。这是与其它软件最根本的不同,也是ggtree能够简单地用图层加注释信息的基础。

1.ggtree安装

if (!requireNamespace("BiocManager", quietly = TRUE))

    install.packages("BiocManager")

BiocManager::install("ggtree")

2.加载包

library("ggplot2")

library("ggtree")

3. 读取数据

tree=read.tree("D:/xxx.tre")

group_file = read.csv("D:/xx.csv",header = T, row.names =1) #读取物种group信息文件,注意要与载入的Tree文件的lable相同,否则无法加载分组颜色!

4. 添加分组信息数据至变量

groupInfo <- split(row.names(group_file), group_file$family) # 提取分组信息

tree1 <- groupOTU(tree, groupInfo)  #将分组信息赋予给树

ggtree(tree, layout = "circular")

5. 运行

ggtree(tree, layout = "circular")  #简单

ggtree(tree,layout = "circular") + geom_tiplab() + geom_point(color='firebrick') #

ggtree(tree1,layout = "circular") +geom_highlight(node = 1872,fill="blue ",alpha=0.5)+  geom_highlight(node=1081,fill=" orange", alpha=0.5)+ geom_highlight(node=1079,fill=" red ")+ geom_cladelabel(node=1872,label="Pinopsida",offset=1.2,barsize = 4,color=" blue ")+geom_cladelabel(node=1081,label="Magnoliopsida",offset=1.2,barsize = 4,color=" orange",)+geom_cladelabel(node=1079,label="Ginkgoopsida",offset=1.2,barsize = 4,color="red")  #自定义


参考:

G Yu, DK Smith, H Zhu, Y Guan, TTY Lam*.ggtree: an R package for visualization and annotation of phylogenetic treeswith their covariates and other associated data. Methods in Ecology andEvolution. 2017, 8(1):28-36.

使用ggtree实现进化树的可视化和注释(转载)。作者:余光创。开发过多个R/Bioconductor包,包括ChIPseeker, clusterProfiler, DOSE,ggtree,GOSemSim和ReactomePA. 链接:https://guangchuangyu.github.io/cn/2016/03/ggtree-for-tree-visualization-annotation/ 

怎样判断newick格式的进化树是有根树,还是无根树?http://blog.sciencenet.cn/blog-656335-926722.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容