R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象

本文主要是介绍R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

设定、映射、分组、匹配图形属性和图形对象

  • 设定和映射
  • 分组
    • 多个分组与单个图形属性
    • 不同图层上的不同分组
      • 给Oxboys数据添加光滑曲线(`smooth`)
    • 修改默认分组(`group`)
  • 匹配图形属性和图形对象
    • 用线性插值法做颜色渐变线条
    • fill构造叠加条形图

设定和映射

除了可以将一个图形属性映射到一个变量,你也可以在图层的参数里将其设定为一个单一值(例如,colour="red")。图形属性可以根据观测的不同而变化,但是参数则不行。下面的例子用图层里的colour参数设定了点的颜色:

p <- ggplot(mtcars, aes(mpg, wt))
p + geom_point(colour = "darkblue")

在这里插入图片描述

注意这里将颜色映射到’darkblue’与上面将颜色设定给’darkblue’的区别

p + geom_point(aes(colour = "darkblue"))

在这里插入图片描述

将颜色设定为'darkblue'(上)与将颜色映射到'darkblue'(下)的区别。

当颜色映射到'darkblue'时,'darkblue'将被看作一个普通的字符串,使用默认的颜色标度进行标度转换,结果得到了粉红色的点和图例。

分组

多个分组与单个图形属性

很多时候,我们都想将数据分成若干组,并用相同的方式对每个组进行渲染。当从总体上来查看数据时,我们通常希望区分每个个体而不是识别他们。这在含有多个个体的纵向数据中是很常见的,而这类图形也常被称为“细面图”。

下面的第一幅图是一个时间序列图,每条线代表一个男孩。通过这个图你可以看到每个男孩的成长轨迹,但是不能识别哪个男孩是哪条轨迹。生成这个图的代码是:

data(Oxboys, package = "nlme")ggplot(Oxboys, aes(age, height, group = Subject)) + geom_line()
#或
qplot(age, height, data = Oxboys, group = Subject, geom = "line")

在这里插入图片描述
正确分组时(分组变量group =Subject)每个个体的折线图(上)。错误的分组时连接所有观测点的折线图(下)。此处省略了分组图形属性,效果等同于group = 1

qplot(age, height, data = Oxboys, geom = "line")

在这里插入图片描述

不同图层上的不同分组

给Oxboys数据添加光滑曲线(smooth)

上图用了和折线图同样的分组变量,得到了每个男孩的拟合直线。下图在平滑层里用了aes(group = 1),得到了所有男孩的拟合直线。

geom_smooth(aes(group = Subject), method = "lm", se = F)qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(method = "lm", se = F)

在这里插入图片描述

p + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)

在这里插入图片描述

修改默认分组(group)

如果想用箱线图来查看每个时期的身高分布,默认的分组是正确的(上图)。

如果想用geom_line()添加每个男孩的轨迹,就需要在新图层里设定 aes(group = Subject)(下图)。

qplot(Occasion, height, data = Oxboys, geom = "boxplot")

在这里插入图片描述

qplot(Occasion, height, data = Oxboys, geom = "boxplot") + geom_line(aes(group = Subject), colour = "#3366FF")

在这里插入图片描述

boysbox <- ggplot(Oxboys, aes(Occasion, height)) + geom_boxplot()
boysbox + geom_line(aes(group = Subject), colour = "#3366FF")

匹配图形属性和图形对象

群组几何对象另一重要议题是,如何将个体的图形属性映射给整体的图形属性。对于个体几何对象而言这不是个问题,因为每一条观测都被一个单一的图形元素所表示。然而,高密度数据将会使得区别单个的点变得困难(或者不可能),这也意味着如果单个点几何对象变成一个群组几何对象,就变成了一大团点。

线条和路径遵循差一原则:观测点比线段数目多一,第一条线段将使用第一条观测的图形属性,第二条线段将使用第二条观测的图形属性,依次类推。这意味着最后一条观测的图形属性将不会被用到,如下图所示。路径和线条的另一个限制是每个个体的线条类型必须是一个常数,因为R不能绘制不同线条类型相连接的线条。

对于线条和路径,线段的图形属性是由起始点的图形属性决定的。

如果颜色是离散的(上图),在相邻的颜色间插入其他颜色是没有任何意义的。

如果颜色是连续的(下图),可以在相邻的颜色间进行插补,但默认条件下R不会这样做。

df <- data.frame(x = 1:3, y = 1:3, colour = c(1, 3, 5))
qplot(x, y, data = df, colour = factor(colour), size = I(5)) + geom_line(aes(group = 1), size = 2)

在这里插入图片描述

qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(size = 2)

在这里插入图片描述

用线性插值法做颜色渐变线条

xgrid <- with(df, seq(min(x), max(x), length = 50))
interp <- data.frame(x = xgrid, y = approx(df$x, df$y, xout = xgrid)$y, colour = approx(df$x, df$colour, xout = xgrid)$y)
qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(data = interp, size = 2)

在这里插入图片描述

fill构造叠加条形图

对于其他的群组几何对象,如多边形,只有当所有个体的图形属性都相同时,该图形属性才会被使用,否则将使用默认值。这适用于fill参数,因为它是整体对象的一个性质:考虑给多边形边界上的点填充不同的色没有任何意义。
当图形属性映射到连续型变量时,这类问题经常会被涉及。因为正如上所述,当映射对象是离散型的变量时,它将默认地把群组几何对象分解成更小的块。这对条形图和面积图的绘制非常有效,因为将每小块堆积起来就可得到和原来未分组前一样形状的图形,如下图所示。

一个条形图(上)按组分解后得到的叠加条形图(下),两者轮廓相同。

qplot(color, data = diamonds)
qplot(color, data = diamonds, fill = cut)

在这里插入图片描述
在这里插入图片描述

这篇关于R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/769320

相关文章

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

滚雪球学Java(87):Java事务处理:JDBC的ACID属性与实战技巧!真有两下子!

咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java SE啦,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好习惯,别被干货淹没了哦~ 🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,助你一臂之力,带你早日登顶🚀,欢迎大家关注&&收藏!持续更新中,up!up!up!! 环境说明:Windows 10

hdu 3065 AC自动机 匹配串编号以及出现次数

题意: 仍旧是天朝语题。 Input 第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

POJ 3057 最大二分匹配+bfs + 二分

SampleInput35 5XXDXXX...XD...XX...DXXXXX5 12XXXXXXXXXXXXX..........DX.XXXXXXXXXXX..........XXXXXXXXXXXXX5 5XDXXXX.X.DXX.XXD.X.XXXXDXSampleOutput321impossible

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX