R语言箱型图 boxplot

2023-10-30 17:38
文章标签 语言 boxplot 箱型

本文主要是介绍R语言箱型图 boxplot,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

boxplot简介

boxplot称为箱型图,又叫做盒状图,胡须图。是用来表示数值类型数据分布状况的统计图。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
在这里插入图片描述四分位数百度百科
第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range,IQR)。
IQR = Q3-Q1
最大值(maximum): Q3 + 1.5IQR
最小值(minimum): Q1 -1.5
IQR
异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR的值。

boxplot 方法

boxplot(x, ...)## S3 method for class 'formula'
boxplot(formula, data = NULL, ..., subset, na.action = NULL,drop = FALSE, sep = ".", lex.order = FALSE)## Default S3 method:
boxplot(x, ..., range = 1.5, width = NULL, varwidth = FALSE,notch = FALSE, outline = TRUE, names, plot = TRUE,border = par("fg"), col = NULL, log = "",pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5),horizontal = FALSE, add = FALSE, at = NULL)

R语言的方法boxplot用来画盒状图。

1 简单例子

> testData <- c(1,3,45,23,11,34,12,13,14,15,80)
> summary(testData)Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 1.00   11.50   14.00   22.82   28.50   80.00 
> boxplot(testData, col = "lightgray")

简单例子

2 盒图分组例子

boxplot有一个参数,formula,比如y~x,表示的就是y被x数据分组。

> height <- c(150, 160, 175, 180, 178)
> gender <- c("M","M","F","F","M")
> 
> boxplot(height~gender, col = "lightgray")
> 

分组例子

3 多个属性表示

我们可以在一个盒图上表示多个属性,比如说,基于上面的例子。可以表示身高在性别上的分布,我们还可以在这个盒图上添加体重在性别上的分组分布。

height <- c(150, 160, 175, 180, 178)
weight <- c(50, 60, 75, 80, 78)
gender <- c("M","M","F","F","M")boxplot(height~gender, at = 1:2 - 0.2, col = "red",  ylim = c(50, 200))
boxplot(weight~gender,  at = 1:2 + 0.2, col = "yellow",add=TRUE)

多个属性表示4 属性的归一化处理
上面的盒图由于属性身高的取值和体重取值相差太大。这样画出来的图比例不合适。我们可以做一个简单的归一化处理。
在这里插入图片描述

height <- c(150, 160, 175, 180, 178)
height <- height/max(height)
weight <- c(50, 60, 75, 80, 78)
weight <- weight/max(weight)
gender <- c("M","M","F","F","M")boxplot(height~gender, boxwex = 0.25, at = 1:2 - 0.2, col = "red", ylim = c(0.6, 1))
boxplot(weight~gender, boxwex = 0.25, at = 1:2 + 0.2, col = "yellow",add=TRUE)

这里需要说明的是,需要根据不同的数据去调整不同的参数画出合适比例的图。
例子里面用到了boxwexylim.

这篇关于R语言箱型图 boxplot的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/309539

相关文章

C语言线程池的常见实现方式详解

《C语言线程池的常见实现方式详解》本文介绍了如何使用C语言实现一个基本的线程池,线程池的实现包括工作线程、任务队列、任务调度、线程池的初始化、任务添加、销毁等步骤,感兴趣的朋友跟随小编一起看看吧... 目录1. 线程池的基本结构2. 线程池的实现步骤3. 线程池的核心数据结构4. 线程池的详细实现4.1 初

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,

C语言指针入门 《C语言非常道》

C语言指针入门 《C语言非常道》 作为一个程序员,我接触 C 语言有十年了。有的朋友让我推荐 C 语言的参考书,我不敢乱推荐,尤其是国内作者写的书,往往七拼八凑,漏洞百出。 但是,李忠老师的《C语言非常道》值得一读。对了,李老师有个官网,网址是: 李忠老师官网 最棒的是,有配套的教学视频,可以试看。 试看点这里 接下来言归正传,讲解指针。以下内容很多都参考了李忠老师的《C语言非

C 语言基础之数组

文章目录 什么是数组数组变量的声明多维数组 什么是数组 数组,顾名思义,就是一组数。 假如班上有 30 个同学,让你编程统计每个人的分数,求最高分、最低分、平均分等。如果不知道数组,你只能这样写代码: int ZhangSan_score = 95;int LiSi_score = 90;......int LiuDong_score = 100;int Zhou

C 语言的基本数据类型

C 语言的基本数据类型 注:本文面向 C 语言初学者,如果你是熟手,那就不用看了。 有人问我,char、short、int、long、float、double 等这些关键字到底是什么意思,如果说他们是数据类型的话,那么为啥有这么多数据类型呢? 如果写了一句: int a; 那么执行的时候在内存中会有什么变化呢? 橡皮泥大家都玩过吧,一般你买橡皮泥的时候,店家会赠送一些模板。 上