发布网友 发布时间:2024-10-09 05:58
共1个回答
热心网友 时间:2024-11-16 19:49
欢迎来到桓峰基因公众号,这里专注于基于R语言的绘图教程,帮助你在SCI文章中制作出精准的图表。今天,我们将深入探讨的是如何利用R语言实现桑基图(Sankey)的绘制,以及如何在文章中进行复现。
桑基图,也称为桑基能量分流图,以其独特而直观的方式展示了数据流动的过程。它起源于1898年 Matthew Henry Phineas Riall Sankey 的蒸汽机效率图,如今被广泛用于展示用户流量等数据。在现代可视化工具中,无论是高级的JavaScript库(如D3、Echarts或highlight),还是常见的数据科学语言(如R和Python),甚至是商业BI工具(如PowerBI和Tableau),都能轻松创建桑基图。
本文将介绍ggalluvial、networkD3和easyalluvial等R语言包的使用方法。桑基图的数据通常由三列组成,包括起点、终点和权重,我们需要预先整理数据,将其转化为适合绘制的格式。
使用宽数据格式的ggalluvial绘制,如官网示例所示,可以帮助你快速理解基本绘制过程。虽然宽数据绘制直观,但定制化可能较复杂。
对于更复杂的长数据,easyalluvial的alluvial_wide函数可以实现,它能对数值变量进行标准化和转换,便于分析。
networkD3提供了交互式的桑基图制作,让你的图表更具动态效果。
在ceRNA研究中,桑基图常用于构建网络图谱,如肝癌研究中的lncRNA-miRNA-mRNA靶向关系图。直接使用文献提供的原始数据,你可以制作出清晰展示网络结构的桑基图。
原始数据可以从相关文献附录获取,或者通过我们整理的本地数据。通过学习,你将掌握制作这类复杂图表的技巧。
跟随桓峰基因,让复杂图表变得简单易懂,赶快关注我们,一起提升你的绘图技能吧!