信息量,信息熵,纯度

2024-05-25 03:08
文章标签 纯度 信息熵 信息量

本文主要是介绍信息量,信息熵,纯度,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

如果看不懂博文,请阅读《信息论基础》一看便懂。

链接:https://pan.baidu.com/s/1T7rS4owM2nU_DP6rthqUPA 
提取码:zu9s 

(1)消息

消息是实体,信息是抽象的。可以从消息中获取信息。消息的表现形式可以是:语言,符号,文字,图片

(2)信息

信息是抽象的,消息是信息的载体。

举例:如果把某个人说的话看成是消息的话,那他话中传递的意思就是信息。

(3)信号

消息经过编码之后就变成信号。比如光信号,电信号。

(4)信息量

例如一句话:“马云是男人”,这句话,大家都知道,毫无价值,信息量为零。

另一句话:“阿里巴巴股票明天要下跌”,那么这句话就有一定的价值,包含有一定的信息量。

那么接下来的问题就是如何把信息量给量化,说白了如何用数学的方式来描绘它。

 

说一千道一万,就是为了让信息量和不确定性划上等号,然后借用数学中的随机变量来描绘信源的消息。 

 

(5)信息熵

注:这个某一特定符号a_i 怎么理解呢?就是指数据集的某一字段(特征)。

 

(6)信息熵与纯度

信息熵越小,就说明不确定性越低,确定性越高,纯度越高。

什么时候确定性高呢?

仍然以上面红白球为例,如果全是红球,那么信息熵为零,不确定性为零,确定性为百分之百,这是我们称样本集合纯度高。 

这篇关于信息量,信息熵,纯度的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1000311

相关文章

信息熵|atttion矩阵的注意力熵

显著图可以看作是模型的注意力图,它标识了模型对输入图像某些区域的关注程度。我们使用 blob 区域(连通的显著区域)来检测模型关注的部分,然后计算这些区域的概率分布,再通过熵来衡量这些区域的“信息量”或“分散度”。 举个简单的例子: Step 1: 假设有一个 4x4 的注意力图 x: x = [[0.1, 0.2, 0.4, 0.1],[0.1, 0.5, 0.3, 0.2],[0.7,

用基于信息熵的topsis方法实现学生成绩的综合排名

TOPSIS方法排序的基本思路是首先定义决策问题的正理想解(即最好的)和负理想解(即最坏的),然后把实际可行解(样本)和正理想解与负理想解作比较。通过计算实际可行解与正理想解和负理想解的加权欧氏距离,得出实际可行解与正理想解的接近程度,以此作为排序的依据。若某个可行解(样本)最靠近理想解,同时又最远离负理想解,则此解排序最靠前。 通常,当排序时有多个指标需要考虑时,常用“专家打分法”来确定各个指

熵的相关概念及相互关系(信息熵,条件熵,相对熵,交叉熵,最大似然估计)

熵:系统混乱程度的度量,系统越混乱,熵越大。 信息熵:信息量的大小的度量,用于描述随机变量的不确定度。事件的不确定性越大,则信息量越大,信息熵越大。定义如下: 条件熵:表示在已知随机变量X的条件下随机变量Y的不确定性。定义如下: 另外,,说明描述X和Y所需的信息(H(X,Y) ࿰

编程实现基于信息熵/基尼指数划分选择的决策树算法

编程实现基于信息熵/基尼指数划分选择的决策树算法 手动建立一个csv文件 #csv的内容为Idx,color,root,knocks,texture,navel,touch,density,sugar_ratio,label1,dark_green,curl_up,little_heavily,distinct,sinking,hard_smooth,0.697,0.46,12,b

信息熵,交叉熵,相对熵,KL散度

熵,信息熵在机器学习和深度学习中是十分重要的。那么,信息熵到底是什么呢?   首先,信息熵是描述的一个事情的不确定性。比如:我说,太阳从东方升起。那么这个事件发生的概率几乎为1,那么这个事情的反应的信息量就会很小。如果我说,太阳从西方升起。那么这就反应的信息量就很大了,这有可能是因为地球的自转变成了自东向西,或者地球脱离轨道去到了别的地方,那么这就可能导致白天变成黑夜,热带雨林将

Linux屏中信息量大,一屏或几屏显示不全怎么办

Linux屏中信息量大,一屏或几屏显示不全 两种方法 1.加个参数 |more 例如:ls -l |more 这样敲完命令后,屏幕信息会停留在第一页上,再敲回车后,又多显示一行。 但如果,信息太多敲回车太麻烦,可以采用第二种方法。 2.写入一个文件中 例如:ls -l > a.txt 这样再次编辑a.txt就可以查看信息了。

信息熵与信息增益的概念

关于熵的概念: 熵是一个信息论中很抽象的概念,从熵定义的角度来看,熵表示一组信息中,所有随机变量出现的期望,他的计算公是: Entropy(S):H(x)=∑p(xi)*log1/(p(xi)) (i=1,2,..n)=-∑p(xi)*log(p(xi)) (i=1,2,..n)其中log的底数是2. 公式的理解是:p(i)表示第i个变量出现的概率,则1/p(i)表示若p(i)发生的样本容量

机器学习-利用信息熵来学习如果分辨好西瓜

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。 我们通常用Entropy(信息熵来度量划分的凌乱程度)。 Ent(D)越小,则信息熵的复杂程度越低,D的纯度(一

纯度高的安卓和混血安卓

安卓阵营纯安卓和改装安卓,纯安卓好用,权限控制力度做到很小,每相权限都交用户控制,权限控制层面可以精确到文件夹和文件,剪切板读和写,而且有精确权限追踪功能,国产高度定制安卓系统只有粗糙访问权限控制,导致手机成了黑箱子,不知道自己那些文件可以被app看到和读取。本来纯安卓很好的,搞不懂为何要高度定制它和改造它,开源的安卓是透明和安全的,越开源越安全

通信系列:通信中如何度量消息中所包含的信息量?如何评估通信系统的性能?

微信公众号上线,搜索公众号小灰灰的FPGA,关注可获取相关源码,定期更新有关FPGA的项目以及开源项目源码,包括但不限于各类检测芯片驱动、低速接口驱动、高速接口驱动、数据信号处理、图像处理以及AXI总线等 本节目录 一、通信中如何度量消息中所包含的信息量?二、等概率离散消息的度量三、信息源的熵Entropy四、如何评估通信系统的性能?五、通信系统的性能指标用什么描述?1、有效性2、