本文主要是介绍杨桃的Python进阶讲座10——数组array(三)数组array归一化和标准化(全网迄今最详细的讲解),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本人CSDN博客专栏:https://blog.csdn.net/yty_7
Github地址:https://github.com/yot777/
在机器学习和深度学习中的数据预处理环节,一个非常重要的步骤是对数据进行归一化和标准化处理。
归一化的概念
什么是归一化?简单的说,就是通过计算把所有的数据归纳统一到指定范围中去,一般这个范围是0~1。
归一化的公式
如何进行归一化?可以通过以下两个公式进行:
(1)变换系数公式
item代表数组每列中所有的元素
max为该列所有数据的最大值,min为该列所有数据的最小值
原始array数组如下:
>>> import numpy as np
>>> data = np.array([[36,46],[45,25],[6,79]])
>>> print(data)
[[36 46][45 25][ 6 79]]
步骤1:求出每列的最小值和最大值
>>> n_max=np.max(data,axis=0)
>>> print(n_max)
[45 79]
>>> n_min=np.min(data,axis=0)
>>> print(n_min)
[ 6 25]
步骤2:由原始矩阵的每一个元素减去该列元素的最小值n_min,得到公式的分子
>>> fenzi = np.subtract(data,n_min)
>>> print(fenzi)
[[30 21][39 0][ 0 54]]
讲解:
这篇关于杨桃的Python进阶讲座10——数组array(三)数组array归一化和标准化(全网迄今最详细的讲解)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!