关于熵的一些数学知识

2024-06-20 15:38
文章标签 数学知识

本文主要是介绍关于熵的一些数学知识,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一些信息熵的含义

(1)   信息熵的定义:假设X是一个离散随即变量,即它的取值范围R={x1,x2...}是有限可数的。设pi=P{X=xi},X的熵定义为:

1                                               (a)

若(a)式中,对数的底为2,则熵表示为H2(x),此时以2为基底的熵单位是bits,即位。若某一项pi=0,则定义该项的pilogpi-1为0。

(2)   设R={0,1},并定义P{X=0}=p,P{X=1}=1-p。则此时的H(X)=-plogp-(1-p)log(1-p)。该H(x)非常重要,称为熵函数。熵函数的的曲线如下图表示:

2

再者,定义对于任意的x∈R,I(x)=-logP{X =x}。则H(X)就是I(x)的平均值。此时的I(x)可视为x所提供的信息量。I(x)的曲线如下:

3

(3)   H(X)的最大值。若X在定义域R={x1,x2,...xr},则0<=H(X)<=logr。

(4)   条件熵:定义4

推导:H(X|Y=y)= ∑p(x|y)log{1/p(x,y)}

H(X|Y)=∑p(y)H(X|Y=y)= ∑p(y)*∑p(x|y)log{1/p(x/y)}

       H(X|Y)表示得到Y后,X的平均信息量,即平均不确定度。

(5)   Fano不等式:设X和Y都是离散随机变量,都取值于集合{x1,x2,...xr}。则

H(X|Y)<=H(Pe)+Pe*log(r-1)

其中Pe=P{X≠Y}。Fano表示在已经知道Y后,仍然需要通过检测X才能获得的信息量。检测X的一个方法是先确定X=Y。若X=Y,就知道X;若X≠Y,那么还有r-1个可能。

(6)   互信息量:I(X;Y)=H(X)-H(X|Y)。I(X;Y)可以理解成知道了Y后对于减少X的不确定性的贡献。

来源:http://blog.csdn.net/kxy_tech/article/details/3993457

I(X;Y)的公式:5

I(X;Y)=∑(x,y)p(x,y)log{p(y|x)/p(y)}

 

(7)   联合熵定义为两个元素同时发生的不确定度。

联合熵H(X,Y)= ∑(x,y)p(x,y)logp(x,y)=H(X)+H(Y|X)

 

(8)   信道中互信息的含义

互信息的定义得:

I(X,Y)=H(X)-H(X|Y)= I(Y,X)=H(Y)-H(Y|X)

若信道输入为H(X),输出为H(Y),则条件熵H(X|Y)可以看成由于信道上存在干扰和噪声而损失掉的平均信息量。条件熵H(X|Y)又可以看成由于信道上的干扰和噪声的缘故,接收端获得Y后还剩余的对符号X的平均不确定度,故称为疑义度。

条件熵H(Y|X)可以看作唯一地确定信道噪声所需要的平均信息量,故称为噪声熵或者散布度。

(9)   I(X,Y)的重要结论

互信息 7

互信息I(X,Y)只是输入信源X的概率分布P(xi)和信道转移概率P(yj|xi)的函数,可以证明当P(xi)一定时,I是关于P(yj|xi)的∪函数,存在极小值;当P(yj|xi)一定时,I是关于P(xi)的∩函数,存在极大值。

(10)   联合熵、条件熵的关系图。H(X)>=H(X|Y),H(Y)>=H(Y|X)。

8

 

 

 

这篇关于关于熵的一些数学知识的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1078547

相关文章

学习算法需要数学知识吗?

目录 算法与数学:看似不可分割的关系常见算法中的数学元素案例分析:不需要高深数学知识的算法1. 二分查找2. 深度优先搜索 (DFS)3. 动态规划:斐波那契数列 如何在有限的数学背景下学习算法1. 专注于算法的逻辑和过程2. 可视化算法流程3. 从简单的实现开始,逐步优化4. 学习算法设计模式5. 实践,实践,再实践6. 关注实际应用 数学如何帮助我们更好地理解和设计算法1. 算法复杂度

SAT数学知识范围分析

为了方便广大考生更好的复习,小编整理了SAT数学考题知识范围增量分析,以供各位考生备考SAT数学,希望对考生复习有所帮助。   美国高考SAT于今年3月份推出了新的SAT考试形式及内容,其中数学部分的考题范围与难易程度有所提高。以前的SAT数学考试程度仅相当于国内初三的数学水平,主要考学生的四则运算、因数、分数、百分数、小数及比率比值的基本知识及运算能力。这些数学的基本知识,对国内初三学生来

HTML5中手势原理分析与数学知识的实践

在这触控屏的时代,人性化的手势操作已经深入了我们生活的每个部分。现代应用越来越重视与用户的交互及体验,手势是最直接且最为有效的交互方式,一个好的手势交互,能降低用户的使用成本和流程,大大提高了用户的体验。 近期,公司的多个项目中都对手势有着较高的需求,已有的手势库无法完全cover,因此便撸了一个轻量、便于使用的移动端手势库。这篇博文主要是解析了移动端常用手势的原理,及从前端的角度学习过程中所使

碰到的有用的数学知识积累

1.  这个公式,常用 2.e^x的泰勒展开 3.泰勒公式。 https://zh.wikipedia.org/wiki/%E6%B3%B0%E5%8B%92%E7%BA%A7%E6%95%B0 ---这些都经常碰到。 1. 定义  e 为下列 极限值: {\displaystyle e=\lim _{n\to \infty }\left(1+

从入门到高阶,读懂机器学习需要哪些数学知识

本篇文章想要说明的是数学并非认识世界的唯一途径,即使数学水平不高的你同样也可以开展机器学习方面的工作和研究。但是不可否认数学是自然科学领域探究真理的有效工具,有了强大的数学背景知识会让你看待问题更加深刻,这就是我们经常会看到很多大牛们都是出身数学专业。另外本文所列举的课程比较多,要想一下子去穷尽所有课程显然也不现实,大可不必打好所有的数学基础再去学机器学习,最好的做法是当你对机器学习本身的理解达到

掌握高等数学、线性代数、概率论所需数学知识及标题建议

在数学的广袤领域中,高等数学、线性代数和概率论作为三大核心分支,不仅在理论研究中占据重要地位,更在实际应用中发挥着举足轻重的作用。为了深入理解和掌握这三门学科,我们需要掌握一系列扎实的数学知识。 高等数学所需数学知识 高等数学是大学数学的重要组成部分,它以微积分为主要内容,研究函数、极限、导数、微分、积分等概念和方法。要学好高等数学,需要掌握以下数学知识: 基本代数知识:包括多项式的加减

【重拾数学知识】导数、极值和最值

前言 在深度学习中,梯度下降法是一种常用的优化算法,用于更新模型参数以最小化损失函数。这梯度下降法中涉及到数学中的导数、极值等相关知识,因此我们重新回顾相关内容,以便加深理解。 相关概念 导数 一个问题 如何求得一个曲线f(x)中任意一点(x0)的斜率? 核心思想:在曲线上另外存在一个P点,P点无限接近x0,x0和P的连线将无限接近x0点的斜率。 在上图中: 我们求x0点和

PR基本概念数学知识

§1、2基本概念 监督学习与非监督学习期望风险与经验风险结构风险最小化(SRM)与经验风险最小化(ERM)期望风险的上界过拟合数据预处理模型评价方法分类与聚类 数学知识 矩阵求逆、矩阵乘法协方差矩阵的计算特征值、特征向量的计算函数求偏导

AI数学知识

AI数学知识 1、线性代数相关(矩阵)1、什么是秩2、奇异值分解3、特征值分解和奇异值分解4、低秩分解 回归分类知识点2、概率论相关1、先验概率和后验概率2、条件概率、全概率公式、贝叶斯公式、联合概率3、最大似然估计4、贝叶斯公式和最大似然估计5、伯努利分布、二项分布6、高斯分布/正态分布期望与均值、方差、标准差、协方差矩阵 7、逻辑函数 3、回归相关1、最小二乘2、正规方程3、梯度下降4、

笔试强训Day19 数学知识 动态规划 模拟

[编程题]小易的升级之路 题目链接:小易的升级之路__牛客网 思路: 按题目写即可 注意辗转相除法。 AC code: #include<iostream>using namespace std;int gcd(int a, int b){return b ? gcd(b, a % b) : a;}int main() {int n, a;while (scanf("%d%