R语言中热图怎么绘制热图

原标题:R语言学习笔记之热图怎麼绘制热图

taoyan:R语言中文社区特约作家伪码农,R语言爱好者爱开源。

ComplexHeatmap包是bioconductor包用于怎么绘制热图复杂热图,它提供了一个灵活的解决方案来安排和注释多个热图它还允许可视化来自不同来源的不同数据之间的关联热图。可通过以下代码安装:

col:颜色向量(离散色彩映射)或颜色映射函数(如果矩阵是连续数)

注意行标题的默认位置是“left”,列标题的默认是“top”可以使用以下选项更改:

row_title_gp:用于怎么绘淛热图行文本的图形参数;

在上面的R代码中,fontface的可能值可以是整数或字符串:1 = plain2 = bold,3 =斜体4 =粗体斜体。如果是字符串则有效值为:

默认情況下,行和列是包含在聚类里的可以使用参数修改:

如果要更改列集群的高度或宽度,可以使用选项column_dend_height

不同的聚类距离计算方式

#也可以自萣义距离计算方式

请注意在上面的R代码中,通常为指定行聚类的度量的参数 clustering_distance_rows显示示例建议对参数clustering_distance_columns(列聚类的度量标准)使用相同的度量标准。

有很多方法来拆分热图一个解决方案是应用k-means使用参数km。

在执行k-means时使用set.seed()函数很重要这样可以在稍后精确地再现结果

#split也可以是一個数据框,其中不同级别的组合拆分热图的行

还可以将用户定义的树形图和分割相结合。在这种情况下split可以指定为单个数字:

name:热图標注的名称

col:映射到df中列的颜色列表

#注释名称可以使用下面的R代码添加

#要在左侧添加注释名称,请使用以下代码

可以使用选项width = unit(3“cm”))来控制热图大小。注意当组合多个热图时,第一个热图被视为主热图剩余热图的一些设置根据主热图的设置自动调整。这些设置包括:删除行集群和标题以及添加拆分等。

在基因表达数据中行代表基因,列是样品值关于基因的更多信息可以在表达热图之后附加,例如基因长度和基因类型

也可以可视化基因组变化和整合不同的分子水平(基因表达,DNA甲基化…)

回复 爬虫爬虫三大案例实战

回复 數据挖掘 R语言入门及数据挖掘

回复 人工智能三个月入门人工智能

回复 数据分析师数据分析师成长之路

回复机器学习机器学习的商业应用

回複 数据科学数据科学实战

回复 常用算法常用数据挖掘算法

  对于怎样用R止语绘heatmap热图支散上有许多相干的帖子,正在此仅总结一下以备往后所需。

  R民网:可下载Windows,MacLinux版本(或源代码)的R步伐;为了便利利用,可一同丅载RStudio直销硬件民网:,应直销硬件为R的IDE

  本文引睹接纳支散上赛季NBA50个球员数据,可从下载果为R撑持支散径,则可间接以下读与数據:

  Rowv:能可按止进止散类阐收并按树状图分列,默许接纳;挨消可赋值为NA;

  Colv:能可按列进止散类阐收并按树状图分列,默许接纳;挨消可赋值为NA;

热图是做分析时常用的展示方式简单、直观、清晰。可以用来显示基因在不同样品中表达的高低、表观修饰水平的高低等任何一个数值矩阵都可以通过合适的方式用熱图展示。

本篇使用R的ggplot2包实现从原始数据读入到热图输出的过程并在教程结束后提供一份封装好的命令行绘图工具,只需要提供矩阵即可一键绘图。

上一篇讲述了Rstudio的使用作为R写作和编译环境的入门后面的命令都可以拷贝到Rstudio中运行,或写成一个R脚本使用Rscript /collections/R_tips/ 中的记录 # 简单說,hjust是水平的对齐方式0为左,1为右0.5居中,0-1之间可以取任意值vjust是垂直对齐方式,0底对齐1为顶对齐,0.5居中0-1之间可以取任意值。

# 连续嘚数字指定最小数值代表的颜色和最大数值赋予的颜色
 



调整背景和背景格线以及X轴、Y轴的标题。(注意灰色的背景没了)


合并以上命令就嘚到了下面这个看似复杂的绘图命令。


 

 
图形出来了就得考虑存储了,
# 可以跟输出文件不同的后缀以获得不同的输出格式
# colormode支持srgb (屏幕)囷cmyk (打印,部分杂志需要看上去有点褪色的感觉)格式
 
至此,完成了简单的heatmap的绘图但实际怎么绘制热图时,经常会碰到由于数值变化佷大导致颜色过于集中,使得图的可读性下降很多因此需要对数据进行一些处理,具体的下次再说

我要回帖

更多关于 热图绘制 的文章

 

随机推荐