本文主要是介绍Python之三大基本库——Numpy(1),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
最近呢学了一些关于python的一些功能,为了更方便快捷高效的实现项目,我们要熟知python的三个基本库:numpy、pandas、matplotlib的功能。由于我也是入门新手,所以先做一些基本的总结,后续有进阶的话会再来更新。
一、Numpy的作用
Numpy是一个Python科学计算库,提供了高性能的多维数组对象(ndarray)以及对这些数组进行操作的函数。它是许多其他数据科学和机器学习库的基础。总而言之,就是可以提高数据计算的库,而后面介绍的pandas、matplotlib也都是基于numpy库的数据基础上进行操作的
主要作用主要包括:
1、矩阵运算:numpy提供了各种矩阵运算,如矩阵乘法、转置和分解等,方便进行矩阵运算。同时,NumPy还支持使用多种矩阵运算,如矩阵乘法、矩阵加法、矩阵求逆等,满足不同场景的需求。
2、存储和处理大型矩阵:numpy是一个开源的数值计算扩展,可以用来存储和处理大型矩阵。它采用了NumPy中的嵌套列表结构,比Python本身的列表结构要高效得多。因此,NumPy可以用来存储和处理大型矩阵,并能够高效地进行矩阵运算。
3、数组操作:numpy的核心功能是ndarray对象,它是一个多维数组,可以进行快速的数值计算和数组操作。numpy提供了丰富的数组操作函数,如索引、切片、形状变换、数学运算、逻辑运算等。
4、数值计算:numpy提供了大量的数学函数,包括线性代数、傅里叶变换、随机数生成等。这些函数可以高效地处理大规模数据集,提供了快速、稳定的数值计算能力。
5、数据处理:numpy可以方便地处理和操作多维数组,可以对数据进行排序、去重、筛选、统计等操作。同时,numpy还提供了对文件的读写功能,可以方便地读取和保存数据。
6、科学计算:numpy广泛应用于科学计算领域,如物理学、生物学、化学、地理学等。它提供了许多科学计算的工具和函数,可以进行数据分析、建模、模拟等。
7、计算速度快:numpy库的计算速度非常快,甚至比python内置的简单运算还要快,这使得它成为很多科学计算和数据分析的首选工具。同时,numpy还有很多优点,比如易于扩展、灵活性高、支持多线程等。因此,numpy库在处理速度问题方面具有很大的潜力
二、numpy的核心对象array
与python中的一切皆对象不同,在numpy中是一切皆数据
numpy的核心数据结构,就叫做array就是数组,array对象可以是一维数组,也可以是多维数组。python的list也可以实现相同的功能,但是array比List的优点在于性能好、包含数组元数据信息、大量的便捷函数
numpy成为事实上的Scipy、Pandas、Scikit-Learn、Tensorflow、PaddlePaddle等框架的“通用底层语言”,numpy的array和python的list的一个区别,是numpy元素必须都是同一种数据类型,比如都是数字int类型,这也是numpy高性能的一个原因
import numpy as np# 创建一维数组
x1 = np.array([0,1,2,3,4,5,6,7,8,9])
# 创建二维或多维数组
x2 = np.array([[0,1,2,3,4],[5,6,7,8,9]])
三、numpy的array的本身属性
1、shape:返回一个元组,表示array的维度
2、ndim:一个数字,表示array的维度的数目
3、size:一个数字,表示array中所有数据元素的数目
4、dtype:返回array中元素的数据类型
x1.shape # 结果(10,)
x2.shape # 结果(2,5)x1.ndim # 结果 1
x2.ndim # 结果 2x1.size # 结果 10
x2.size # 结果 10x1.dtype # 结果 dtype(int32)
x2.dtype # 结果 dtype(int32)
四、创建array的方法
1、从Python的列表List和嵌套列表创建array
2、使用预定函数arange、ones/ones_like、zeros/zeros_like、empty/empty_like、full/full_like、eye等函数创建
3、生成随机数的np.random模块构建
# 方法1
list1 = [0,1,2,3,4,5]
x1 = np.array(list1)
list2 = [[0,1,2],[3,4,5]]
x2 = np.array(list2)# 方法2 使用关键字arange创建数字序列
# arange([start,] stop[, step,], dtype=None)
np.arange(10)
np.arange(2,10,2)# 方法3 使用ones创建全是1的数组
# np.ones(shape, dtype=None, order='C')shape : int or tuple of ints Shape of the new
# array,e.g.,(2,3)or 2.
np.ones(10)
np.ones((2,3))
# 使用ones_like创建形状相同的数组
# ones_like(shape, dtype=float, order='C')
np.ones_like(x1)
np.ones_like(x2)# 方法4 使用zeros创建全是0的数组
# np.zeros(shape, dtype=None, order='C')
np.zeros(10)I
np.zeros((2,4))
# 使用zeros_like创建形状相同的数组
# np.zeros_like(a, dtype=None)
np.zeros_like(x1)
np.zeros_like(x2) # 方法5 使用empty创建全是随机数字的数组
# empty(shape, dtype=float, order='C') 注意:数据是未初始化的,里面的值可能是随机值不要用
np.empty(10)
np.empty((2,4))
# 使用empty_ike创建形状相同的数组empty_like(prototype, dtype=None)
np.empty_like(x)
np.empty_like(X)# 方法6 使用fuIl创建指定值的数组
# np.full(shape, fill value, dtype=None, order='C')
np.fu11(10,666)
np.full((2,4),333)
# 使用full_like创建形状相同的数组
# np.full_like(a,fill_value, dtype=None)
np.full_like(x,666)
np.full_like(X, 666)# 方法7 使用random模块生成随机数的数组,里面的参数代表数组维度数
# randn(d0, d1, ..., dn)
np.random. randn ()
np.random. randn (3)
np.random.randn(3,2)
np.random.randn(3,2,4)
五、array本身支持的大量操作和函数
1、直接逐元素的加减乘除等算数操作
2、更好用的面向多维的数组索引
3、求sum/mean等聚合函数
4、线性代数函数,比如求解逆矩阵、求解方程组
# 这些操作如果用Python实现需要写很多for循环,用numpy数组很容易
A = np.arange(10)reshape(2,5)
A.shape
# 每个元素分别+1 或 *3
A+1
A*3
# 一些其它函数计算
np.sin(A)
np.exp(A)
# 用于等维度的两个数组之间的每个数据之间的运算
B = np.random.randn(2,5)
A+B
A-B
六、numpy对数组按照索引查询
1、基础索引
针对于一维数组来说,与python中的切片获取方式是一致的,但是对于多维数据就不同
# 分别用行坐标、列坐标,实现行列筛选
# x[0][0]相当于x[0,0]
x[-1,2]# 可以省略后续索引值,返回的数据是降低一个维度的数组
# 这里的2,其实是要筛选第2行
x[2]
# 筛选-1对应的行
x[-1]
# 筛选多行
x[:-1]
# 筛选多行,然后筛选多列
x[:2, 2:4]
# 筛选所有行,然后筛选多列
x[:,2]
注意:切片的修改会修改原来的数组,Numpy不会修改原来的元素
原因:Numpy经常要处理大数组,避免每次都复制,节省时间和空间
2、神奇索引(花式索引)
用整数数组进行的索引,叫做神奇索引,就是在中括号中传入一个list
# 先后构建一个两行两列的数组,然后用indexs列表传入就可以全部取出来
indexs = np.array([0,2],[1,3])
x[indexs]实例:获取数组中最大的前N个数字
# 一维数组:随机生成1到100之间的,10个数字
arr = np.random.randint(l,100,10)
# arr.argsort()会返回排序后的索引index
# 取最大值对应的3个下标
arr.argsort()[-3:]
arr[arr,argsort()[-3:]]# 多维数组 筛选多列,行不能省略
X = np.arange(20).reshape(4,5)
X[:,[0,2, 3]]
array([[ 0,NN3]5[10,12,13],[15,17,18]])
# 同时指定行列-列表
# 返回的是[(0,1),(2,3),3,4)]位置的数字
X[[0,2,3],[1,3,4]]
3、布尔索引
注意:布尔索引选择的数据是数组的拷贝
X = np.arange(20).reshape(4,5)
# X>5的boolean数组,既有行,又有列
X>5
# 如下返回的是(行,列)一维结果
X[X>5]# 举例:怎样把第3列大于5的行筛选出来
X[:,3]>5
# 下面是筛选出有多少行>5的数据
X[X[:,3]>5] = 666# 组合查询
# 注意,每个条件都得加小括号
condition = (x%2==0)|(x>7)
X[condition]
内容太长了,我们分两张进行讲解吧,想要找下一篇的小伙伴们,看博主链接或主页寻找。
这篇关于Python之三大基本库——Numpy(1)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!