R语言的高颜值的配图法则论文写作

作者:  时间:2018-12-20  热度:

  最后终于找到一篇发表在 Science Advances 的文章——通过高通量测序分析揭示了小 RNA 在小鼠卵母细胞和早期胚胎中的调控作用。

  文章中除了复杂的 RNA Seq、Chip Seq 分析,图表的搭配十分美观。虽说我们是崇高的科(ke)学 (yan) 家 (gou),但关乎我们毕业大计的 SCI 也得要「高颜值」。

  以常见的热图(heatmap)为例,在分子生物学涉及高通量以及芯片的文章中,尤其是 RNA-seq 相关论文里,热图是文章里经常出现的数据可视化形式。

  一张美观的热图不仅可以直观呈现多样本、多个基因的全局表达量变化,以及多样本或多基因表达量的聚类关系,更是如下图般令人赏心悦目。

  绘制热图有多种方法,常见的大家有用 MeV,各种网页工具,甚至有用 Excel 再上手 PS 的。可是小伙伴们,21 世纪连小学生都会编程了,你咋还在用软件做热图?

  且不说用 Excel 出来的热图截图清晰度能不能达到发文章的标准,先来看看它的美观度,笔者在这里随机打开一个数据集,利用色阶给大家用 Excel 做一下热图,效果如下:

  What?这完全没有办法聚类好么,我还怎么看差异变化?把这样的热图给老板,别说文章凉了,能不能走出老板办公室都是问题。

  现在的高分论文一个个华丽丽的配图,动辄 R 语言、Python…听起来就高级,笔者当年凭着中学的记忆笨笨地操作 Excel,真是苦不堪言!

  于是就有小伙伴问了,没时间系统地学习编程,那种「套代码公式就能搞定 R 语言绘图,懂中文就能会的教程」,能不能给我来一份啊?

  呐~笔者整理出一份基础教程,为了照顾零基础的电脑盲同学,我们从安装 R 语言开始介绍。给大家两个网址,里面详细介绍了 R 语言[2]和 RStudio[3]的安装。

  通过上面的学习,我们大致了解基本图的绘制,所有的修饰都建立这些图形之上,这部分给大家说说如何让基本图更「高大上」,通过基本图的修饰,我们就能完成大部分的配图模仿了。

  对于笔者这样直男审美的大汉来说,有一个华丽丽的配色包可谓是莫大的福利,那么 R 语言中是否有一个这样的配色包呢?

  按照前文的方式我们配置好工作目录,加载好数据以及 ggplot2、RColorBrewer 程序包。

   display.brewer.all()#用这个命令可以生成一张图查看本程序的调色板,如下图所示:

  坐标轴文本修饰可以更加清晰的按照作者的意愿表达,文章中的配图坐标轴都有明显的修饰痕迹:

  误差线是大家经常需要的通常用于显示潜在的误差或相对于系列中每个数据标志的不确定程度。误差线可以用标准差 (平均偏差) 或标准误差, 用以下这个命令可以为图表添加误差线:

  到此为止我们已经可以处理较为复杂的代码了,不信你试试模仿下文章中那个高级条形图?

  本次的学习大家也可以运用 R 语言绘制这样的图形,一个超长的函数也可以简单的拆分成几个小命令:

  到此为止相信大家可以轻松运用 R 语言绘制基本图以及进行常规修饰了,终于可以和那些野鸡绘图方式说拜拜了。

  什么?觉得还是不够用?经过两个阶段的艰苦奋战,大家的绘图之路已经爬完大半程,接下来小编将给大家带来 R 语言的高级绘图。那我们废话少说,继续满满的干货之路。

  关于基因热图还真是让人又爱又恨,这部分将使用专门的热图绘制工具给大家讲解:

  setwd(D:/)#我把文件放在 D 盘,大家根据自己的情况设置

  #文件一般需要 csv 格式,其中 header = T 代表首行为表头,row.names = 1 代表第一列是名字,不做读取。

  好啦,基本常用的功能已经总结给大家了,需要大家注意的是需要删掉后面的标注,选择自己需要的功能。以下两图为例:

  火山图经常用于展示差异表达的基因,常用于芯片、测序等组学检测技术的结果中,与热图可是一对好兄弟:

美文.分享

人喜欢

上一篇下一篇
猜你喜欢
点击加载更多内容  ↓