R语言ggplot2包绘制散点图详解

2024-05-26 23:32

本文主要是介绍R语言ggplot2包绘制散点图详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • List item
    R语言的ggplot包可以实现各种复杂的制图功能,本文以散点图为例,介绍ggplot2代码的使用方法。
    首先,使用R内置数据attitude绘制complaints和learning的散点图。请注意ggplot2语法和R原生代码的区别。ggplot2采用图层模式,不同图层用“+”叠加。
> head(attitude,3)rating complaints privileges learning raises critical advance
1     43         51         30       39     61       92      45
2     63         64         51       54     63       73      47
3     71         70         68       69     76       86      48

首先用ggplot()函数指定数据源,之后使用geom_point()函数绘制散点图,该函数使用mapping参数传入x和y所在的列。

ggplot(data = attitude) + geom_point(mapping = aes(x = complaints, y = learning))

image.png

那么,如何对散点进行分类呢?我们采用CO2数据。

> head(CO2)
Grouped Data: uptake ~ conc | PlantPlant   Type  Treatment conc uptake
1   Qn1 Quebec nonchilled   95   16.0
2   Qn1 Quebec nonchilled  175   30.4
3   Qn1 Quebec nonchilled  250   34.8
4   Qn1 Quebec nonchilled  350   37.2
5   Qn1 Quebec nonchilled  500   35.3
6   Qn1 Quebec nonchilled  675   39.2

这次在aes中指定了color属性,设置为Plant列,这样可以对不同的Plant对应的散点应用不同的颜色。

ggplot(data = CO2) + geom_point(mapping = aes(x = conc, y = uptake, color = Plant))

image.png

同样,还可以指定size参数,使散点大小与某一参数相关。

ggplot(data = CO2) + geom_point(mapping = aes(x = conc, y = uptake, color = Plant, size=conc))

image.png

指定shape参数,使散点的形状与某一参数相关。

ggplot(data = CO2) + geom_point(mapping = aes(x = conc, y = uptake, color = Plant, size=conc, shape=Type))

image.png

下面使用iris数据展示ggplot2的更多功能。

> head(iris,3)Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa

在mapping的aes参数中,还可以指定透明度alpha。

ggplot(data = iris) + geom_point(mapping = aes(x = Sepal.Length, y = Sepal.Width, alpha=  Petal.Length , color = Species, shape= Species, size= Petal.Width))

image.png

以上这些图像都采取了默认的设置,如果我们想自定义散点的形状、颜色等参数时,该怎么办呢?
image.png

引入color参数,可以自行设置颜色;使用shape参数可以自定义形状,各形状对应的序号如下。注意到color等参数是与mapping参数并列的。

ggplot(data = iris) + geom_point(mapping = aes(x = Sepal.Length, y = Sepal.Width), color = "red",shape=11)
ggplot(data = iris) + geom_point(mapping = aes(x = Sepal.Length, y = Sepal.Width, color= Species), color = c("#0FC62A","orange","#ABC"))

image.png

2.3.3.2. 多图布局
如何将不同分类的变量绘制到不同的图上,实现多图布局呢?
在geom_point函数后用“+”连接facet_wrap()函数,其中首个参数为用于分类的变量前加“~”,nrow参数表示每行布局的图像数。

ggplot(data = iris) + geom_point(mapping = aes(x = Sepal.Length, y = Sepal.Width, color = Species, shape= Species, size= Petal.Length)) + facet_wrap(~ Species, nrow = 2)

image.png

如果需要用两个变量实现多图布局,可使用facet_grid()函数指定行列对应的变量,用“~”分隔。

ggplot(data = CO2) + geom_point(mapping = aes(x = conc, y = uptake, color=Plant)) + facet_grid(Type ~ Treatment)

image.png

若“~”前后的参数换为“.”,则只在列或行进行多图布局。

ggplot(data = CO2) + geom_point(mapping = aes(x = conc, y = uptake, color=Plant)) + facet_grid(Type ~ .)
ggplot(data = CO2) + geom_point(mapping = aes(x = conc, y = uptake, color=Plant)) + facet_grid(. ~ Treatment)

散点图常常会出现点重叠的情况,尤其是数据四舍五入后作图。通过调整参数position = “jitter”,可以避免这种网格化,为每个点添加少量随机噪声。因为没有两个点可能会接收到相同数量的随机噪声,所以这就使避免了散点堆积的情况。

ggplot(data = CO2) + geom_point(mapping = aes(x = conc, y = uptake, color=Plant), , position = "jitter") + facet_grid(Type ~ Treatment)

image.png

主要参考文献:# R for Data Science
https://r4ds.had.co.nz/data-visualisation.html

这篇关于R语言ggplot2包绘制散点图详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1005888

相关文章

MySQL 中的 JSON 查询案例详解

《MySQL中的JSON查询案例详解》:本文主要介绍MySQL的JSON查询的相关知识,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql 的 jsON 路径格式基本结构路径组件详解特殊语法元素实际示例简单路径复杂路径简写操作符注意MySQL 的 J

C语言中位操作的实际应用举例

《C语言中位操作的实际应用举例》:本文主要介绍C语言中位操作的实际应用,总结了位操作的使用场景,并指出了需要注意的问题,如可读性、平台依赖性和溢出风险,文中通过代码介绍的非常详细,需要的朋友可以参... 目录1. 嵌入式系统与硬件寄存器操作2. 网络协议解析3. 图像处理与颜色编码4. 高效处理布尔标志集合

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

Python ZIP文件操作技巧详解

《PythonZIP文件操作技巧详解》在数据处理和系统开发中,ZIP文件操作是开发者必须掌握的核心技能,Python标准库提供的zipfile模块以简洁的API和跨平台特性,成为处理ZIP文件的首选... 目录一、ZIP文件操作基础三板斧1.1 创建压缩包1.2 解压操作1.3 文件遍历与信息获取二、进阶技

一文详解Java异常处理你都了解哪些知识

《一文详解Java异常处理你都了解哪些知识》:本文主要介绍Java异常处理的相关资料,包括异常的分类、捕获和处理异常的语法、常见的异常类型以及自定义异常的实现,文中通过代码介绍的非常详细,需要的朋... 目录前言一、什么是异常二、异常的分类2.1 受检异常2.2 非受检异常三、异常处理的语法3.1 try-

Java中的@SneakyThrows注解用法详解

《Java中的@SneakyThrows注解用法详解》:本文主要介绍Java中的@SneakyThrows注解用法的相关资料,Lombok的@SneakyThrows注解简化了Java方法中的异常... 目录前言一、@SneakyThrows 简介1.1 什么是 Lombok?二、@SneakyThrows

Java中字符串转时间与时间转字符串的操作详解

《Java中字符串转时间与时间转字符串的操作详解》Java的java.time包提供了强大的日期和时间处理功能,通过DateTimeFormatter可以轻松地在日期时间对象和字符串之间进行转换,下面... 目录一、字符串转时间(一)使用预定义格式(二)自定义格式二、时间转字符串(一)使用预定义格式(二)自

Redis Pipeline(管道) 详解

《RedisPipeline(管道)详解》Pipeline管道是Redis提供的一种批量执行命令的机制,通过将多个命令一次性发送到服务器并统一接收响应,减少网络往返次数(RTT),显著提升执行效率... 目录Redis Pipeline 详解1. Pipeline 的核心概念2. 工作原理与性能提升3. 核

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum(枚举)是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚