踏上R语言之旅:解锁数据世界的神秘密码(一)

2024-04-19 09:12

本文主要是介绍踏上R语言之旅:解锁数据世界的神秘密码(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

R语言学习


文章目录

  • R语言学习
  • 数据矩阵与R语言表示
    • 1.创建一个向量(随机变量、一维数组)
    • 2.创建一个矩阵(二维数组)
    • 3.矩阵转置
    • 4.矩阵相加减
    • 5.矩阵相乘
    • 6.矩阵对角元素相关运算
    • 7.矩阵求逆
    • 8.矩阵的特征值与特征向量
    • 9.矩阵的Choleskey分解
    • 10.矩阵奇异值分解
    • 11.矩阵QR分解
    • 12.矩阵kronecker积
    • 13.矩阵的维数
    • 14.矩阵的行和、列和、行平均与列平均
  • 总结


数据矩阵与R语言表示

1.创建一个向量(随机变量、一维数组)

在R中可以用函数c()来创建一个向量,例如

>x1=c(171,175,159,155,152,158,154,164,168,166,159,164)
> x2=c(57,64,41,38,35,44,41,51,57,49,47,46)

这里,x1,x2分别为行向量,也可以认为是1行12列的矩阵。
函数length()可以返回向量的长度,mode()可以返回向量的数据类型,例如:

> length(x1)
[1] 12
> mode(x1)
[1] "numeric"

2.创建一个矩阵(二维数组)

(1)合并命令。可以用rbind()cbind()将两个以上的向量或矩阵合并起来,

rbind()表示按行合并,cbind()则表示按列合并。

> rbind(x1,x2)[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12]
x1  171  175  159  155  152  158  154  164  168   166   159   164
x2   57   64   41   38   35   44   41   51   57    49    47    46
> cbind(x1,x2)x1 x2[1,] 171 57[2,] 175 64[3,] 159 41[4,] 155 38[5,] 152 35[6,] 158 44[7,] 154 41[8,] 164 51[9,] 168 57
[10,] 166 49
[11,] 159 47
[12,] 164 46

(2)生成矩阵。在R中可以用函数matrix()来创建一个矩阵,引用该函数时需要输入必要的参数值。

> matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)[,1]
[1,]   NA

data项为必要的矩阵元素,nrow为行数,ncol为列数,注意nrow与ncol的乘积应为矩阵元素个数,byrow项控制排列元素时是否按行进行,dimnames给定行和列的名称,例如:

 matrix(x1,nrow=3,ncol=4)[,1] [,2] [,3] [,4]
[1,]  171  155  154  166
[2,]  175  152  164  159
[3,]  159  158  168  164
 matrix(x1,nrow=4,ncol=3)[,1] [,2] [,3]
[1,]  171  152  168
[2,]  175  158  166
[3,]  159  154  159
[4,]  155  164  164
 matrix(x1,nrow=4,ncol=3,byrow=T)[,1] [,2] [,3]
[1,]  171  175  159
[2,]  155  152  158
[3,]  154  164  168
[4,]  166  159  164

3.矩阵转置

A为mxn矩阵,A’为其转置矩阵,求A’在R中可用函数t(),例如:

> A=matrix(1:12,nrow=3,ncol=4)
> A[,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> t(A)[,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12

4.矩阵相加减

在R中对同行同列矩阵相加减,可用符号“+”、“-”,例如:

> A=B=matrix(1:12,nrow=3,ncol=4)
> A+B[,1] [,2] [,3] [,4]
[1,]    2    8   14   20
[2,]    4   10   16   22
[3,]    6   12   18   24
> A-B[,1] [,2] [,3] [,4]
[1,]    0    0    0    0
[2,]    0    0    0    0
[3,]    0    0    0    0

5.矩阵相乘

A为mxn矩阵,B为nxk矩阵,在R中求AB可用符号“%*%",例如:

> A=matrix(1:12,nrow=3,ncol=4)
> B=matrix(1:12,nrow=4,ncol=3)
> A%*%B[,1] [,2] [,3]
[1,]   70  158  246
[2,]   80  184  288
[3,]   90  210  330

6.矩阵对角元素相关运算

若要取一个方阵的对角元素,对一个向量应用diag()函数将产生以这个向量为对角元素的对角矩阵,对一个正整数k应用diag()函数将产生k维单位矩阵,例如:

> A=matrix(1:16,nrow=4,ncol=4)
> diag(A)
[1]  1  6 11 16
> diag(diag(A))[,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    6    0    0
[3,]    0    0   11    0
[4,]    0    0    0   16
> diag(4)[,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    1    0    0
[3,]    0    0    1    0
[4,]    0    0    0    1

7.矩阵求逆

矩阵求逆可用solve(),应用solve(A,b)运算结果可解线性方程组Ax=b,若b缺省,则系统默认为单位矩阵,由此可用其进行矩阵求逆,例如:

> A=matrix(rnorm(16),4,4);
> A[,1]       [,2]        [,3]       [,4]
[1,] -0.2930984 -1.7887997 -0.13792868  0.8021037
[2,] -1.3322062  0.3419297  1.18732716 -1.8372907
[3,]  1.0203442 -2.4283146  0.03727872 -2.4674615
[4,] -0.9507527  0.6046697 -0.79238198 -0.1241637
> solve(A)[,1]        [,2]       [,3]        [,4]
[1,] -0.35916036 -0.30123211  0.1268138 -0.38288995
[2,] -0.39760300 -0.02206908 -0.1143649  0.03076075
[3,]  0.08927873  0.35986115 -0.2013035 -0.74780287
[4,]  0.24412384 -0.09740967 -0.2433257 -0.19990320

8.矩阵的特征值与特征向量

矩阵A的谱分解为A=UΛU’,其中Λ是由A的特征值组成的对角矩阵,U的列为A的特征值对应的特征向量,在R中可以用函数eigen()得到U和Λ。

eigen(x,symmetric,only.values=FALSE,EISPACK=FALSE)

其中,x为矩阵,symmetric项指定矩阵x是否为对称矩阵,若不指定,系统将自动检测x是否为对称矩阵,例如:

> A=diag(4)+1;A;[,1] [,2] [,3] [,4]
[1,]    2    1    1    1
[2,]    1    2    1    1
[3,]    1    1    2    1
[4,]    1    1    1    2
> A.e=eigen(A,symmetric=T)
> A.e
eigen() decomposition
$values
[1] 5 1 1 1$vectors[,1]       [,2]       [,3]       [,4]
[1,] -0.5  0.8660254  0.0000000  0.0000000
[2,] -0.5 -0.2886751 -0.5773503 -0.5773503
[3,] -0.5 -0.2886751 -0.2113249  0.7886751
[4,] -0.5 -0.2886751  0.7886751 -0.2113249> A.e$vector%*%diag(A.e$values)%*%t(A.e$vectors)[,1] [,2] [,3] [,4]
[1,]    2    1    1    1
[2,]    1    2    1    1
[3,]    1    1    2    1
[4,]    1    1    1    2

上面最后的语句作用是重构原始矩阵,其中 A.e$vector 是原始矩阵的特征向量,diag(A.e$values) 是一个以特征值为对角线元素的对角矩阵,t(A.e$vectors) 是特征向量的转置矩阵。

9.矩阵的Choleskey分解

对于正定矩阵A,可对其进行Choleskey分解,即A=P’P,其中,P为上三角矩阵,在R中可以用函数chol()进行Choleskey分解,例如:

> A.c=chol(A)
> A.c[,1]      [,2]      [,3]      [,4]
[1,] 1.414214 0.7071068 0.7071068 0.7071068
[2,] 0.000000 1.2247449 0.4082483 0.4082483
[3,] 0.000000 0.0000000 1.1547005 0.2886751
[4,] 0.000000 0.0000000 0.0000000 1.1180340
> t(A.c)%*%A.c[,1] [,2] [,3] [,4]
[1,]    2    1    1    1
[2,]    1    2    1    1
[3,]    1    1    2    1
[4,]    1    1    1    2

10.矩阵奇异值分解

A为mxn矩阵,rank(A)=r,可以分解为A=UDV’,其中,U’U=V’V=I。在R中可以用函数svd()进行奇异值分解,例如:

> A=matrix(1:18,3,6);A;[,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    4    7   10   13   16
[2,]    2    5    8   11   14   17
[3,]    3    6    9   12   15   18
> A.s=svd(A)
> A.s
$d
[1] 4.589453e+01 1.640705e+00 1.366522e-15$u[,1]        [,2]       [,3]
[1,] -0.5290354  0.74394551  0.4082483
[2,] -0.5760715  0.03840487 -0.8164966
[3,] -0.6231077 -0.66713577  0.4082483$v[,1]        [,2]       [,3]
[1,] -0.07736219 -0.71960032 -0.4076688
[2,] -0.19033085 -0.50893247  0.5745647
[3,] -0.30329950 -0.29826463 -0.0280114
[4,] -0.41626816 -0.08759679  0.2226621
[5,] -0.52923682  0.12307105 -0.6212052
[6,] -0.64220548  0.33373889  0.2596585> A.s$u%*%diag(A.s$d)%*%t(A.s$v)[,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    4    7   10   13   16
[2,]    2    5    8   11   14   17
[3,]    3    6    9   12   15   18

11.矩阵QR分解

A为mxn矩阵时可以进行QR分解,A=QR,其中,Q’Q=I,在R中可以用函数qr()进行QR分解,例如:

> A=matrix(1:16,4,4)
> qr(A)
$qr[,1]        [,2]          [,3]          [,4]
[1,] -5.4772256 -12.7801930 -2.008316e+01 -2.738613e+01
[2,]  0.3651484  -3.2659863 -6.531973e+00 -9.797959e+00
[3,]  0.5477226  -0.3781696  1.601186e-15  2.217027e-15
[4,]  0.7302967  -0.9124744 -5.547002e-01 -1.478018e-15$rank
[1] 2$qraux
[1] 1.182574e+00 1.156135e+00 1.832050e+00 1.478018e-15$pivot
[1] 1 2 3 4attr(,"class")
[1] "qr"

12.矩阵kronecker积

nxm矩阵A与hxk矩阵B的kronecker积为一个nhxmk维矩阵,在R中,kronecker积可以用函数kronecker()来计算,例如:

> A=matrix(1:4,2,2)
> A[,1] [,2]
[1,]    1    3
[2,]    2    4
> B=matrix(rep(1,4),2,2);B;[,1] [,2]
[1,]    1    1
[2,]    1    1
> kronecker(A,B)[,1] [,2] [,3] [,4]
[1,]    1    1    3    3
[2,]    1    1    3    3
[3,]    2    2    4    4
[4,]    2    2    4    4

13.矩阵的维数

在R中很容易得到一个矩阵的维数,函数dim()将返回一个矩阵的维数,nrow()返回行数,ncol()返回列数,例如:

> A=matrix(1:12,3,4)
> dim(A)
[1] 3 4
> nrow(A)
[1] 3
> ncol(A)
[1] 4

14.矩阵的行和、列和、行平均与列平均

一个矩阵的和、平均数以及列的和、平均数,例如:
rowSums() rowMeans() colSums() colMeans()

> rowSums(A)
[1] 22 26 30
> rowMeans(A)
[1] 5.5 6.5 7.5
> colSums(A)
[1]  6 15 24 33
> colMeans(A)
[1]  2  5  8 11
> A[,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12

上述关于矩阵行和列的操作,还可以使用apply()函数实现:

apply(X,MARGIN,FUN,…)
其中,X为矩阵,MARGIN用来指定是对行运算还是对列运算,MARGIN=1表示对行运算,MARGIN=2表示对列运算,FUN用来指定运算函数,”…"用来给定FUN中需要的其他参数,例如:

> apply(A,1,sum)
[1] 22 26 30
> apply(A,1,mean)
[1] 5.5 6.5 7.5
> apply(A,2,sum)
[1]  6 15 24 33
> apply(A,2,mean)
[1]  2  5  8 11

apply()函数还可以对矩阵的行或列进行其他运算,例如计算每一列的方差:

> A=matrix(rnorm(10),2,5)
> apply(A,2,var)
[1] 0.06233338 1.72555863 0.45365134 0.83043694 0.37709323
> apply(A,2,function(x,a)x*a,a=2)[,1]      [,2]       [,3]       [,4]       [,5]
[1,] -2.437330 -1.090969 -1.5564223  1.9951652  0.3086047
[2,] -1.731167  2.624468  0.3486265 -0.5823327 -1.4282735

注:最后一式与A*2效果一致,旨在说明如何应用apply函数

总结

主要运用的是线性代数里面所涉及到的知识,不得不说,R语言所包含的函数着实比较丰富,所学知识取自王斌会老师的《多元统计分析及R语言建模》,上述内容均本人手敲,创作不易,收获不浅,继续加油!

这篇关于踏上R语言之旅:解锁数据世界的神秘密码(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/917128

相关文章

SpringValidation数据校验之约束注解与分组校验方式

《SpringValidation数据校验之约束注解与分组校验方式》本文将深入探讨SpringValidation的核心功能,帮助开发者掌握约束注解的使用技巧和分组校验的高级应用,从而构建更加健壮和可... 目录引言一、Spring Validation基础架构1.1 jsR-380标准与Spring整合1

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

SpringBatch数据写入实现

《SpringBatch数据写入实现》SpringBatch通过ItemWriter接口及其丰富的实现,提供了强大的数据写入能力,本文主要介绍了SpringBatch数据写入实现,具有一定的参考价值,... 目录python引言一、ItemWriter核心概念二、数据库写入实现三、文件写入实现四、多目标写入

使用Python将JSON,XML和YAML数据写入Excel文件

《使用Python将JSON,XML和YAML数据写入Excel文件》JSON、XML和YAML作为主流结构化数据格式,因其层次化表达能力和跨平台兼容性,已成为系统间数据交换的通用载体,本文将介绍如何... 目录如何使用python写入数据到Excel工作表用Python导入jsON数据到Excel工作表用

Mysql如何将数据按照年月分组的统计

《Mysql如何将数据按照年月分组的统计》:本文主要介绍Mysql如何将数据按照年月分组的统计方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql将数据按照年月分组的统计要的效果方案总结Mysql将数据按照年月分组的统计要的效果方案① 使用 DA

Go 语言中的select语句详解及工作原理

《Go语言中的select语句详解及工作原理》在Go语言中,select语句是用于处理多个通道(channel)操作的一种控制结构,它类似于switch语句,本文给大家介绍Go语言中的select语... 目录Go 语言中的 select 是做什么的基本功能语法工作原理示例示例 1:监听多个通道示例 2:带

鸿蒙中Axios数据请求的封装和配置方法

《鸿蒙中Axios数据请求的封装和配置方法》:本文主要介绍鸿蒙中Axios数据请求的封装和配置方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1.配置权限 应用级权限和系统级权限2.配置网络请求的代码3.下载在Entry中 下载AxIOS4.封装Htt

C语言函数递归实际应用举例详解

《C语言函数递归实际应用举例详解》程序调用自身的编程技巧称为递归,递归做为一种算法在程序设计语言中广泛应用,:本文主要介绍C语言函数递归实际应用举例的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录前言一、递归的概念与思想二、递归的限制条件 三、递归的实际应用举例(一)求 n 的阶乘(二)顺序打印

Python从零打造高安全密码管理器

《Python从零打造高安全密码管理器》在数字化时代,每人平均需要管理近百个账号密码,本文将带大家深入剖析一个基于Python的高安全性密码管理器实现方案,感兴趣的小伙伴可以参考一下... 目录一、前言:为什么我们需要专属密码管理器二、系统架构设计2.1 安全加密体系2.2 密码强度策略三、核心功能实现详解

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,