【个人总结】概率论与数理统计在人工智能领域的应用

2024-03-01 20:38

本文主要是介绍【个人总结】概率论与数理统计在人工智能领域的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

概率论与数理统计在人工智能领域的应用

  • 概率论与数理统计在人工智能领域的应用
    • 一、绪论
      • 1.新人工智能时代
      • 2.基础数学理论的作用
      • 3.概率论与数理统计应用概述
    • 二、深度学习原理
    • 三、概率论与深度学习
      • 1.深度学习中的随机事件
      • 2.基于概率的预测分析
      • 3.概率分布的应用
    • 四、统计学与深度学习
      • 1.拟合
      • 2.偏差与方差
      • 3.正则化
      • 5.归一化
    • 五、小结
    • 六、参考文献

概率论与数理统计在人工智能领域的应用

由于概率论课程作业要求,以及之前对于深度学习有了一点点了解,所以写了本文,一方面进行个人学习总结,另一方面与大家分享一些观点。初学人工智能、概率论及统计,本文不恰当之处还请大家包涵与指正。

一、绪论

1.新人工智能时代

尽管摩尔定律失效的趋势已不可避免,近十年内硬件性能已然取得了重大的突破。超级计算机、高性能个人电脑已经逐渐走进我们的生活。这样的契机下,过去因计算性能不足而搁置的诸多人工智能理论又焕发了新的生机。
无论是自然语言处理还是计算机视觉,大数据分析或是语音识别,人工智能的发展给我们带来的便利已经融入了我们生活的方方面面。计算机能够认识图片中的事物、能够听懂人类的指令、能够自主的聊天、能够玩电子游戏,甚至战胜世界第一的围棋选手……新人工智能时代在带给我们惊喜与感慨的同时,让我们不禁想揭开其原理的神秘面纱,究竟是什么让它如此强大?

2.基础数学理论的作用

其实,人工智能的许多理论在上个世纪就早已提出,囿于计算机硬件性能而迟迟不得发展。而作为其主流算法的“深度学习”,可以说是概率论与数理统计、微积分、线性代数融合的产物。借助于计算机相关理论与计算能力,让计算机能够利用数字来认识和分析世界,并作出自己的判断与决策。人工智能算法,可以说是很多数学理论的计算机学科应用。
通过微积分,我们实现了许多函数层面对数字的分析,从二维到三维再到N维空间,偏导、微分、极值等等理论发挥了重要的作用。而线性代数成为了我们进行计算的重要工具,利用矩阵、向量等理论与性质,对大量数据进行有效的分析与处理。

3.概率论与数理统计应用概述

概率论与数理统计在其中的作用却是渗透到各个方面,从偏差、方差分析以更好的拟合到计算概率以实现预测,从随机初始化以加快训练速度到正则化、归一化数据处理以避免过拟合……概率为人工智能提供随机性,为预测提供基础;而统计则对数据进行处理与分析,让结果更好的满足我们的要求,更具有普适性和一般性,以便于我们的应用。
统计学的各种理论应用之广,让人们不禁感叹人工智能就是统计学的一种应用,尽管略有片面,但统计学方法的确在人工智能领域发挥了空前的作用。

二、深度学习原理

讨论概率论与数理统计在人工智能领域的应用,就不得不先介绍深度学习的基本原理。
所谓深度学习,其实就是通过深层的神经网络对数据进行学习。而深层则是指隐层在两层及以上的神经网络。而单隐层的情况,则是我们所说的浅层神经网络。


图2.1浅层神经网络

如图是最简单的只有一个隐层且该隐层含有三个神经元的神经网络,其作用是通过神经元以乘以权重与偏差相加,再通过激活函数对结果进行处理来计算输入的值。而深度网络,简单的说,会把最后的输出结果y ̂作为下一层的输入向量,如此下去,构成深层的神经网络.

图2.2深层神经网络
可以发现,神经网络便是对输入的向量进行多层的处理,得到最终的结果。
而我们要做的,则是通过输入向量计算得到最佳的各层参数(包括权重和偏差)以实现对数据的拟合。拟合的方法,我们采用通过y ̂与真实的y进行计算数据差异,得到损失值,然后反向传播计算偏导求得梯度,通过梯度下降的方法逐渐逼近损失值的最小值。

三、概率论与深度学习

1.深度学习中的随机事件

随机事件在深度学习中有很多体现,例如随机初始化和Dropout正则化方法。
当训练神经网络时,权重随机初始化是很重要的,如果把权重或者参数都初始化为0,那么梯度下降会不起作用。简单的说,由于权重均为0,导致对称的操作造成输出结果相同,所以无论多少层都无法正确拟合。所以我们需要随机初始化。通常,我们可以通过正态分布进行随机初始化,经测试具有比较好的效果。


图3.1 Dropout正则化方法

图3.1 Dropout正则化方法

而Dropout正则化方法,则是为了防止过拟合进行的随机权重失效。每个神经元都有失效的可能性,这种随机事件会使结果更具一般性。通过随机失活,我们得到了一个更小规模的神经网络,但其对于其他数据的普适性会更好,而不会过分拟合训练样本。
显然,从这两个例子可以看出,随机性事件让我们的结果更具一般性,也能够加速我们的训练过程,避免没有必要的计算。

2.基于概率的预测分析

深度学习很重要的应用便是对数据进行分析和预测。而既然是预测,可能的结果自然不止一个,或者说每个结果都有发生的概率,而我们需要做的便是寻找概率最高的事件。
这里不得不提到Softmax回归的方法,它能够在试图识别某一分类时做出预测,不只是两个分类。假设最后的输出层是一个四维向量,对应着四种可能性,我们对于输出的z[l]计算 t=ez[l],然后得到.

a([l])=e(z^([l]) )/(∑_(j=1)^4▒t_i )

显然,a [l]大于等于0且小于等于1。同样通过梯度下降进行学习,我们通过得到的参数能够预测各种结果的概率。
另外,我们通过测试集往往可以通过大量的数据中预测成功的频率来估计概率,从而评价我们的训练的模型的成功率。
除了以上算法,深度学习中的贝叶斯决策等也源于概率论。

3.概率分布的应用

深度学习很重要的一个应用便是实现预测。例如预测图中是否存在一只猫,或者预测用户是否会购买某样东西。显然,这是一个二元问题。二元问题分布的模拟便是概率论中的伯努利分布。而多元问题,很多时候我们采用的是正态分布来模拟。
概率分布更常见的应用在于权重矩阵的初始化,经测试,以正态分布来初始化能加快学习速度,所以作为初始化的常用方法之一。

四、统计学与深度学习

1.拟合

深度学习的核心原理某种意义上可以用拟合来代替,通过多层网络、多神经元以及激活函数构建一个计算图,并通过对样本的学习进行拟合,从而求得较好的参数集。得到训练好的模型后,便可以通过代入计算进行决策。
而拟合,则是统计学的一个重要内容。我们熟知的线性回归中的最小二乘法便是一种线性拟合方式,这种统计学中利用已有数据对未知数据进行判断和决策的思想,很好的应用在了深度学习中。所谓神经网络,可以说是应用于复杂数据的一种复杂的拟合方式。而统计学中很多概念如无偏估计、有偏估计同样应用在了拟合的优化中。

2.偏差与方差

偏差与方差是统计学中很重要的概念。例如样本标准偏差、总体标准偏差以及方差的统计学公式分别如下:




而在深度学习中,偏差和方差同样可以用来描述拟合情况。其中,偏差越高说明拟合的效果越差,而方差过高则意味着过度拟合。深度学习参数修正与神经网络改善的一大难题便是如何得到一组恰到好处的偏差和方差。拟合效果则没有办法进行比较准确的预测,过度拟合又会降低模型的普适性。因此,我们往往需要很多统计方法来进行最佳的优化。

3.正则化

深度学习中的正则化是一种用来避免过拟合的方法。当我们的样本拟合程度过高时,如上文所述,会降低模型的普适性,而正则化则是用来降低过拟合问题。除了之前提到的Dropout正则化方法,L2正则化也是很常见的正则化类型。将L2正则化项


L2正则化项

与损失函数相加,求导后通过梯度下降便可以实现“权重衰减”,从而减弱权值矩阵的作用实现正则化来避免过拟合。 ### 4.指数加权平均的偏差修正 统计学中的指数加权平均数在统计学中也叫做指数加权移动平均,通过移动平均线同样可以得到数据的平均值并进行算法优化。指数加权平均事实上是一种累加效应,随着数据增多,之前数据的影响指数型下降。其公式为vt=βv t−1+(1−β)θ t,从中可以看到这种指数下降的趋势。而如果初始化v_0=0,这个时候我们则需要偏差修正,尤其是在估测初期通过v t/(1-β t)来代替v t,这样可以有效的进行偏差修正。进而我们利用指数加权移动平均数可以优化各种算法,更好的实现参数优化。 从这个例子可以看出,统计学中的加权移动平均与偏差修正都很好的应用在了深度学习中。

5.归一化

归一化是一种数据处理方式,广泛应用与各个学科。能将数据的某种绝对值变成相对值,有效的缩小量值并简化计算。通过归一化,能够使输入的特征值均值为0,方差为1,从而可以加速学习。
另一方面,归一化能够有效的去除一些“特性”的干扰,从而提高模型的一般性,找到数据的核心特征。而归一化方法本身,就与统计学中的均值与方差关系密切,同样也是统计学在深度学习的重大应用。

五、小结

作为基础数学,概率论与数理统计中的很多基础理论在人工智能领域都有着重要的应用。打破了硬件性能的局限,很多统计学的大规模数据处理得到了有效的实现。并且,当今人工智能领域很多创新性算法的核心也源于对于统计学知识的进一步应用。
从我们上面的讨论,无不看出概率与统计在人工智能领域各种算法中的应用与其关键性。无论是数据的处理还是分析,数据的拟合还是决策,概率与统计都提供了重要支持。
概率与统计由于其源于生活与生产,又能有效的应用于生活与生产,且应用面十分广泛。除了生活中的各类问题,在前沿的人工智能领域,同样有着重大的作用。
人类所生活的世界充满着信息与数据,如何有效的利用这些数据为人类服务,这显然是一个能有效提高生产力的课题。计算机科学中应用概率与统计的相关知识,挖掘其价值,让经典数学在人工智领域发挥着经久不息的力量。

六、参考文献

[1] 黄海广. 深度学习课程笔记[EB/OL]. https://github.com/fengdu78/deeplearning_ai_books.
[2] man_world. 指数加权移动平均(Exponential Weighted Moving Average)[EB/OL]. https://blog.csdn.net/mzpmzk/article/details/80085929.
[3] Acjx. 机器学习之正则化(Regularization)[EB/OL]. https://www.cnblogs.com/jianxinzhou/p/4083921.html.
[4] 洪亮劼. 为什么人工智能时代我们要学好概率统计?[EB/OL]. https://www.sohu.com/a/199864004_99986943.

这篇关于【个人总结】概率论与数理统计在人工智能领域的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/763736

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/