生信小工具 | 手把手教你从序列查找开始,绘制漂亮的进化树

2022-10-11 05:23:23, 小迈 武汉迈特维尔生物科技有限公司



系统发育进化树(Phylogenetic tree)也叫系统进化树,它利用树状分支图形来表示各基因或物种之间的亲缘关系,是系统生物学研究中的重要手段。一个结构清晰、注释清楚、配色美观的进化树往往能为文章增添几分优雅气质。






在基因研究中,往往会通过进化树鉴定基因在种内及种间的基因亚族,探究目标基因可能行使的功能。那么如何绘制一个美观的进化树?下面就以拟南芥已报道的BAHD酰基转移酶基因为例,查找水稻BAHD酰基转移酶基因,结合常用的MEGA、AI(Adobe illustrator)、iTOL软件,给大家完整演示进化树的制作。


1.同源基因序列查找(如果已经准备好基因序列了可以跳过此步骤)

https://plants.ensembl.org/index.html

进入点击选择水稻基因组及注释,然后选择在线BLAST:


粘贴已报道的拟南芥BAHD基因蛋白序列,运行BLASTP:


运行完成后分别下载每一个比对结果,第一列是比对到的水稻转录本ID,经过筛选去重后,得到水稻中比对同源性高的水稻BAHD基因号,然后通过BioMart在线工具获得这些基因的蛋白序列信息。



BioMart工具中,设置选择水稻基因组,并利用上一步中比对后去重到的水稻转录本ID作为Filter标准,获得水稻对应转录本的蛋白序列信息:



这样我们就利用拟南芥报道的BAHD酰基转移酶基因,通过在线工具,查找到了水稻BAHD酰基转移酶基因及序列信息。将它们整理合并成.fa格式,用于后续进化树分析。



2.多重序列比对

https://www.megasoftware.net/

官网下载安装MEGA软件,导入整理好的蛋白或核酸序列,利用MEGA里整合的clustalW和MUSCLE插件进行多重序列比对,如下图所示:



选择多重序列比对软件和参数(以MUSCLE为例)



保存为.mas或.masx格式的结果文件,此时多重序列比对就完成了



3.构建进化树

关闭当前窗口,回到主界面,点击PHYLOGENY,此时有多种构建进化树的方法可供选择,下面以领接法(Neighbor-Joining)为例:



运行完毕后会自动弹出进化树界面,此时进化树就构建好了,保存为兼容性强的Newick(.nwk)格式文件,可以用多种工具打开进行美观性调整和注释:



4.MEGA进化树美化

进化树默认矩形展示,当基因比较多的时候,进化树如下图所示,既不美观,也几乎看不到细节:


我们用MEGA打开进化树,在功能面板上选择环形展示、仅展示拓扑结构、设置字体大小,进化树就变的清晰明了:



此时如果想要标注出关注的基因,可以在格式工具里,对标签设置形状和颜色标注,同样还可以设置树枝线的粗细、相对长度等。这样就得到了一个比较美观的圆形、带标记的进化树:



最后,导出PDF或SVG格式矢量图:


5.AIAdobe illustrator美化

MEGA的进化树标注功能有限,比如无法添加区块颜色,不能自由添加文字标注,而这些需求在我们获得矢量图之后,可以使用AI软件自由实现,使用AI打开保存的进化树矢量图。初始效果如下,里面的文字、线条、标记等元素皆可选中,用小工具进行调整:



那么我们如果复现示例图1里的那种不规则区块背景,只需要曲率工具就可以实现:


然后设置不规则形状的填充颜色、透明度,并置于底层:



依次添加,然后用直接选择工具拖拉不规则形状上的锚点,可以对形状进行微调:


最后使用文字工具,添加注释文本,保存即可:

那么我们就得到了一个包含个性化颜色、文字注释的圈状进化树,如下所示:


6.iTOL在线交互工具

iTOL(Interaction Tree Of Life:http://itol.embl.de/)是一个集在线展示、注释和管理进化树的交互工具。绘图过程中可以随意调整树枝、标签的颜色、形状和字体,发布以来广受好评。


使用也很简单,首先,注册并上传我们前面得到的nwk格式的树文件:


点击树文件之后,自动链接到主界面的圈状树。点击树枝可以针对某一树枝修改树枝和标签的大小、颜色等;左侧快捷按钮可添加文字注释、形状;控制面板的操作按钮也很多,用于全局设置进化树类型、标签和树枝的字体、大小、颜色等。


比如,我们可以点击进化树,将不同树枝的标签添加不同的背景色:

 

另外,官方也支持上传进化树注释(Tree annotation)文件,对进化树添加注释,感兴趣的同学可以参考官方帮助文档:

https://itol.embl.de/help.cgi#annot

及示例注释文件:

https://itol.embl.de/help/example_data.zip

下面以label颜色设置+外圈色块注释为例。首先,准备两个excel表格,格式如下:


将这两个表格分别保存在两个txt文本文件中,上传至iTOL上打开的进化树,即可获得包括label颜色设置+外圈色块注释的进化树,如下所示:


此时,目标进化树就生成了,还可以通过控制面板调整注释细节。


松针状进化树也可以通过Basic-->unrooted设置获得:


最后就是数据导出了,有多种格式可供选择,建议选择矢量图,后续还可以用AI进行个性化调整。


99%的代谢组学研究者都在阅读下文:

蛋白专题合集

Biomarker专题合集

空间代谢组合集

肠道菌群&微生物专题

小小果蝇竟暗藏玄机?高通量测序揭示黑腹果蝇样本疾病相关蛋白调节神经元形态的机制

迈维云平台系列课操作教程,公号回复“迈维云”即可


客服微信:metware888

咨询电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved