R语言【dplyr】——case_when()是一般向量化的 if-else(),该函数允许您将多个 if_else() 语句矢量化

本文主要是介绍R语言【dplyr】——case_when()是一般向量化的 if-else(),该函数允许您将多个 if_else() 语句矢量化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Package dplyr version 1.1.4


Parameters

case_when(..., .default = NULL, .ptype = NULL, .size = NULL)

参数【...】<dynamic-dots> 一组两面公式(two-sided formulas)。

  • 公式左边(left hand side,LHS)决定了哪些值符合这种情况。
  • 公式右边(right hand side,RHS)提供了替换值。
  • LHS 输入的结果必须是逻辑向量。
  • RHS 输入将被强制转换为通用类型。
  • 所有输入的数据都将被回收利用,恢复到其平常大小。尽管如此,我们还是鼓励所有 LHS 输入的大小相同。
  • 循环主要适用于 RHS 输入,在这种情况下,您可能会提供一个大小为 1 的输入,它将被循环为 LHS 输入的大小。
  • 输入 NULL 将被忽略。

参数【.default】:当所有 LHS 输入返回 FALSE NA 时使用的值。

  • 参数【.default】的大小必须为 1 或与参数【...】计算出的通用大小相同。
  • 参数【.default】与 RHS 输入一起参与通用类型的计算。
  • LHS 条件中的 NA 值将被视为 FALSE,这意味着这些位置的结果将被分配为参数【.default】值。要以不同的方式处理条件中的缺失值,必须在它们落入参数【.default】之前明确地用另一个条件来捕获它们。这通常涉及 is.na(x) ~ value 的一些变体,以适应您对 case_when() 的使用。
  • 如果为 NULL(默认值),将使用缺失值。

参数【.ptype】:一个可选的原型,用于声明所需的输出类型。如果提供,将覆盖 RHS 输入的通用类型。

参数【.size】:一个可选的大小,用于声明所需的输出大小。如果提供,它将覆盖从参数【...】计算出的通用大小。


Value

一个向量,其大小与参数【...】中输入值计算出的共同大小相同,类型与参数【...】中 RHS 输入值的共同类型相同。


Examples

1. 最简单的例子

x <- 1:70
case_when(x %% 35 == 0 ~ "fizz buzz",x %% 5 == 0 ~ "fizz",x %% 7 == 0 ~ "buzz",.default = as.character(x)
)
 [1] "1"         "2"         "3"         "4"         "fizz"      "6"        [7] "buzz"      "8"         "9"         "fizz"      "11"        "12"       
[13] "13"        "buzz"      "fizz"      "16"        "17"        "18"       
[19] "19"        "fizz"      "buzz"      "22"        "23"        "24"       
[25] "fizz"      "26"        "27"        "buzz"      "29"        "fizz"     
[31] "31"        "32"        "33"        "34"        "fizz buzz" "36"       
[37] "37"        "38"        "39"        "fizz"      "41"        "buzz"     
[43] "43"        "44"        "fizz"      "46"        "47"        "48"       
[49] "buzz"      "fizz"      "51"        "52"        "53"        "54"       
[55] "fizz"      "buzz"      "57"        "58"        "59"        "fizz"     
[61] "61"        "62"        "buzz"      "64"        "fizz"      "66"       
[67] "67"        "68"        "69"        "fizz buzz"

2. 与 if 语句一样,条件会按顺序进行检测,所以您应该将条件按照最严格到最宽松排列,否则会出现以下情况

x <- 1:70
case_when(x %%  5 == 0 ~ "fizz",x %%  7 == 0 ~ "buzz",x %% 35 == 0 ~ "fizz buzz",.default = as.character(x)
)
 [1] "1"    "2"    "3"    "4"    "fizz" "6"    "buzz" "8"    "9"   
[10] "fizz" "11"   "12"   "13"   "buzz" "fizz" "16"   "17"   "18"  
[19] "19"   "fizz" "buzz" "22"   "23"   "24"   "fizz" "26"   "27"  
[28] "buzz" "29"   "fizz" "31"   "32"   "33"   "34"   "fizz" "36"  
[37] "37"   "38"   "39"   "fizz" "41"   "buzz" "43"   "44"   "fizz"
[46] "46"   "47"   "48"   "buzz" "fizz" "51"   "52"   "53"   "54"  
[55] "fizz" "buzz" "57"   "58"   "59"   "fizz" "61"   "62"   "buzz"
[64] "64"   "fizz" "66"   "67"   "68"   "69"   "fizz"

3. 如果元素不符合任何条件,那么就会触发参数【.default】,默认为NA

x <- 1:70
case_when(x %% 35 == 0 ~ "fizz buzz",x %% 5 == 0 ~ "fizz",x %% 7 == 0 ~ "buzz",
)
 [1] NA          NA          NA          NA          "fizz"     [6] NA          "buzz"      NA          NA          "fizz"     
[11] NA          NA          NA          "buzz"      "fizz"     
[16] NA          NA          NA          NA          "fizz"     
[21] "buzz"      NA          NA          NA          "fizz"     
[26] NA          NA          "buzz"      NA          "fizz"     
[31] NA          NA          NA          NA          "fizz buzz"
[36] NA          NA          NA          NA          "fizz"     
[41] NA          "buzz"      NA          NA          "fizz"     
[46] NA          NA          NA          "buzz"      "fizz"     
[51] NA          NA          NA          NA          "fizz"     
[56] "buzz"      NA          NA          NA          "fizz"     
[61] NA          NA          "buzz"      NA          "fizz"     
[66] NA          NA          NA          NA          "fizz buzz"

4. 请注意,LHS 上的 NA 值将被视为 FALSE,并触发参数【.default】。如果要使用不同的值,必须明确处理它们。处理缺失值的具体方法取决于您使用的 LHS 条件集

x <- 1:70
x[2:4] <- NA_real_
case_when(x %% 35 == 0 ~ "fizz buzz",x %% 5 == 0 ~ "fizz",x %% 7 == 0 ~ "buzz",is.na(x) ~ "nope",.default = as.character(x)
)
 [1] "1"         "nope"      "nope"      "nope"      "fizz"     [6] "6"         "buzz"      "8"         "9"         "fizz"     
[11] "11"        "12"        "13"        "buzz"      "fizz"     
[16] "16"        "17"        "18"        "19"        "fizz"     
[21] "buzz"      "22"        "23"        "24"        "fizz"     
[26] "26"        "27"        "buzz"      "29"        "fizz"     
[31] "31"        "32"        "33"        "34"        "fizz buzz"
[36] "36"        "37"        "38"        "39"        "fizz"     
[41] "41"        "buzz"      "43"        "44"        "fizz"     
[46] "46"        "47"        "48"        "buzz"      "fizz"     
[51] "51"        "52"        "53"        "54"        "fizz"     
[56] "buzz"      "57"        "58"        "59"        "fizz"     
[61] "61"        "62"        "buzz"      "64"        "fizz"     
[66] "66"        "67"        "68"        "69"        "fizz buzz"

5. case_when() 对所有 RHS 表达式进行求值,然后通过提取所选(通过 LHS 表达式)部分来构建结果

y <- seq(-2, 2, by = .5)
case_when(y >= 0 ~ sqrt(y),.default = y
)
[1] -2.0000000 -1.5000000 -1.0000000 -0.5000000  0.0000000  0.7071068
[7]  1.0000000  1.2247449  1.4142136
Warning message:
In sqrt(y) : 产生了NaNs

6. 当你想创建一个依赖于现有变量复杂组合的新变量时,case_when() mutate() 中特别有用

starwars
# A tibble: 87 × 14name       height  mass hair_color skin_color eye_color birth_year<chr>       <int> <dbl> <chr>      <chr>      <chr>          <dbl>1 Luke Skyw…    172    77 blond      fair       blue            19  2 C-3PO         167    75 NA         gold       yellow         112  3 R2-D2          96    32 NA         white, bl… red             33  4 Darth Vad…    202   136 none       white      yellow          41.95 Leia Orga…    150    49 brown      light      brown           19  6 Owen Lars     178   120 brown, gr… light      blue            52  7 Beru Whit…    165    75 brown      light      blue            47  8 R5-D4          97    32 NA         white, red red             NA  9 Biggs Dar…    183    84 black      light      brown           24  
10 Obi-Wan K…    182    77 auburn, w… fair       blue-gray       57  
# ℹ 77 more rows
# ℹ 7 more variables: sex <chr>, gender <chr>, homeworld <chr>,
#   species <chr>, films <list>, vehicles <list>, starships <list>
# ℹ Use `print(n = ...)` to see more rows
starwars %>%select(name:mass, gender, species) %>%mutate(type = case_when(height > 200 | mass > 200 ~ "large",species == "Droid" ~ "robot",.default = "other"))
# A tibble: 87 × 6name               height  mass gender    species type <chr>               <int> <dbl> <chr>     <chr>   <chr>1 Luke Skywalker        172    77 masculine Human   other2 C-3PO                 167    75 masculine Droid   robot3 R2-D2                  96    32 masculine Droid   robot4 Darth Vader           202   136 masculine Human   large5 Leia Organa           150    49 feminine  Human   other6 Owen Lars             178   120 masculine Human   other7 Beru Whitesun Lars    165    75 feminine  Human   other8 R5-D4                  97    32 masculine Droid   robot9 Biggs Darklighter     183    84 masculine Human   other
10 Obi-Wan Kenobi        182    77 masculine Human   other
# ℹ 77 more rows
# ℹ Use `print(n = ...)` to see more rows

7. case_when() 不是一个整洁的条件函数。如果想重复使用相同的模式,请在自定义函数中调用 case_when()

case_character_type <- function(height, mass, species) {case_when(height > 200 | mass > 200 ~ "large",species == "Droid" ~ "robot",.default = "other")
}case_character_type(150, 250, "Droid")
case_character_type(150, 150, "Droid")
[1] "large"
[1] "robot"

8. 上述函数也可在 mutate() 中使用

starwars %>%mutate(type = case_character_type(height, mass, species)) %>%pull(type)
 [1] "other" "robot" "robot" "large" "other" "other" "other" "robot"[9] "other" "other" "other" "other" "large" "other" "other" "large"
[17] "other" "other" "other" "other" "other" "robot" "other" "other"
[25] "other" "other" "other" "other" "other" "other" "other" "other"
[33] "other" "other" "other" "large" "large" "other" "other" "other"
[41] "other" "other" "other" "other" "other" "other" "other" "other"
[49] "other" "other" "other" "other" "other" "other" "other" "large"
[57] "other" "other" "other" "other" "other" "other" "other" "other"
[65] "other" "other" "other" "other" "other" "other" "large" "large"
[73] "other" "robot" "other" "other" "other" "large" "large" "other"
[81] "other" "large" "other" "other" "other" "robot" "other"

9. case_when() 忽略 NULL 输入。当你想只在特定条件下使用模式时,这很有用。在这里,我们将利用 if 在没有 else 子句时返回 NULL 这一事实。

case_character_type <- function(height, mass, species, robots = TRUE) {case_when(height > 200 | mass > 200 ~ "large",if (robots) species == "Droid" ~ "robot",.default = "other")
}starwars %>%mutate(type = case_character_type(height, mass, species, robots = FALSE)) %>%pull(type)
 [1] "other" "other" "other" "large" "other" "other" "other" "other"[9] "other" "other" "other" "other" "large" "other" "other" "large"
[17] "other" "other" "other" "other" "other" "other" "other" "other"
[25] "other" "other" "other" "other" "other" "other" "other" "other"
[33] "other" "other" "other" "large" "large" "other" "other" "other"
[41] "other" "other" "other" "other" "other" "other" "other" "other"
[49] "other" "other" "other" "other" "other" "other" "other" "large"
[57] "other" "other" "other" "other" "other" "other" "other" "other"
[65] "other" "other" "other" "other" "other" "other" "large" "large"
[73] "other" "other" "other" "other" "other" "large" "large" "other"
[81] "other" "large" "other" "other" "other" "other" "other"

每种情况都按顺序进行检测,每个元素的第一个匹配值决定了其在输出向量中的相应值。如果没有匹配的情况,则使用 参数【.default】 作为最后的 "else "声明。

这篇关于R语言【dplyr】——case_when()是一般向量化的 if-else(),该函数允许您将多个 if_else() 语句矢量化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/534853

相关文章

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

在MySQL执行UPDATE语句时遇到的错误1175的解决方案

《在MySQL执行UPDATE语句时遇到的错误1175的解决方案》MySQL安全更新模式(SafeUpdateMode)限制了UPDATE和DELETE操作,要求使用WHERE子句时必须基于主键或索引... mysql 中遇到的 Error Code: 1175 是由于启用了 安全更新模式(Safe Upd

Python itertools中accumulate函数用法及使用运用详细讲解

《Pythonitertools中accumulate函数用法及使用运用详细讲解》:本文主要介绍Python的itertools库中的accumulate函数,该函数可以计算累积和或通过指定函数... 目录1.1前言:1.2定义:1.3衍生用法:1.3Leetcode的实际运用:总结 1.1前言:本文将详

Go语言中三种容器类型的数据结构详解

《Go语言中三种容器类型的数据结构详解》在Go语言中,有三种主要的容器类型用于存储和操作集合数据:本文主要介绍三者的使用与区别,感兴趣的小伙伴可以跟随小编一起学习一下... 目录基本概念1. 数组(Array)2. 切片(Slice)3. 映射(Map)对比总结注意事项基本概念在 Go 语言中,有三种主要

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

MySQL数据库函数之JSON_EXTRACT示例代码

《MySQL数据库函数之JSON_EXTRACT示例代码》:本文主要介绍MySQL数据库函数之JSON_EXTRACT的相关资料,JSON_EXTRACT()函数用于从JSON文档中提取值,支持对... 目录前言基本语法路径表达式示例示例 1: 提取简单值示例 2: 提取嵌套值示例 3: 提取数组中的值注意

C语言中自动与强制转换全解析

《C语言中自动与强制转换全解析》在编写C程序时,类型转换是确保数据正确性和一致性的关键环节,无论是隐式转换还是显式转换,都各有特点和应用场景,本文将详细探讨C语言中的类型转换机制,帮助您更好地理解并在... 目录类型转换的重要性自动类型转换(隐式转换)强制类型转换(显式转换)常见错误与注意事项总结与建议类型

Go语言利用泛型封装常见的Map操作

《Go语言利用泛型封装常见的Map操作》Go语言在1.18版本中引入了泛型,这是Go语言发展的一个重要里程碑,它极大地增强了语言的表达能力和灵活性,本文将通过泛型实现封装常见的Map操作,感... 目录什么是泛型泛型解决了什么问题Go泛型基于泛型的常见Map操作代码合集总结什么是泛型泛型是一种编程范式,允

mysqld_multi在Linux服务器上运行多个MySQL实例

《mysqld_multi在Linux服务器上运行多个MySQL实例》在Linux系统上使用mysqld_multi来启动和管理多个MySQL实例是一种常见的做法,这种方式允许你在同一台机器上运行多个... 目录1. 安装mysql2. 配置文件示例配置文件3. 创建数据目录4. 启动和管理实例启动所有实例