非参数估计法之 parzen窗方法和k近邻方法估计概率密度

2024-01-29 20:50

本文主要是介绍非参数估计法之 parzen窗方法和k近邻方法估计概率密度,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

无论是参数估计还是费参数估计 其目的都是为了求出总体的概率密度函数

parzen窗

基本原理

嗯哼哼 ,画个圈圈 ,在圈圈里面又画一个正方形,在往圈圈里面随机扔豆豆,豆豆在正方形里面的概率约等于在正方形内的总数k比豆豆总数n即k/n,其正好是正方形与圈圈的面积比,假设正方形的面积为R

设豆豆落在正方形里面的概率为P = k/n,假设豆豆落在正方形的每一个点上的概率一样,则落在正方形中的任意一点的概率为

p = (k/n)/R

若没一点的概率密度服从函数p(x)


当R足够小,p(x)变化也会变得特别小,则


Parzon窗估计

定义窗函数:假设Rn是一个d维的超立方体。令hn为超立方体一条边的长度,则体积:




上式为超立方体函数

落入以X为中心的立方体区域的样本数为:


X处的密度估计为


只要函数满足如下条件,        就可以作为窗函数



故窗函数泛化之高斯函数





其中μ = 0,δ² =1

(为什么不是μ = x,δ² =???还是说正态窗函数就是这个样?


故Parzen窗估计过程是一个内插过程,一般样本xi距离x越近,对概率密度估计的贡献越大,越远贡献越小 ,和局部线性回归的思想类似

栗子

来源于http://blog.sina.com.cn/s/blog_679e13290101cpr1.html

数字图像处理也用过类似思想,平滑

一般Parzen估计的性能与窗宽参数hn紧密相关

如一元正态分布 变大则分母变大整体变小,而指数部分肯定为负数所以,h越大会越趋近于0,故副i整体变化不大

所以

较大时,x 和中心 xi 距离大小的影响程度变弱,估计的p(x)较为平滑,分辨率较差

同理,当较小时,x 和中心 xi 距离大小的影响程度变强,估计的p(x)较为尖锐,分辨率较好。

同时 再来理解下  中n时什么

n表示的样本数

每一次样本数发生变化时都可以取不同,n和h对其概率密度的影响



其中




近邻估计

基本原理

固定样本数量Kn ,调整区域体积大小Vn,直至有Kn个样本落入区域中

固定样本数为,在X附近选取与之最近的个样本,计算个样本分布的最小体积

同样概率密度估值为




这篇关于非参数估计法之 parzen窗方法和k近邻方法估计概率密度的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/658146

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Git中恢复已删除分支的几种方法

《Git中恢复已删除分支的几种方法》:本文主要介绍在Git中恢复已删除分支的几种方法,包括查找提交记录、恢复分支、推送恢复的分支等步骤,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录1. 恢复本地删除的分支场景方法2. 恢复远程删除的分支场景方法3. 恢复未推送的本地删除分支场景方法4. 恢复

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

Window Server2016加入AD域的方法步骤

《WindowServer2016加入AD域的方法步骤》:本文主要介绍WindowServer2016加入AD域的方法步骤,包括配置DNS、检测ping通、更改计算机域、输入账号密码、重启服务... 目录一、 准备条件二、配置ServerB加入ServerA的AD域(test.ly)三、查看加入AD域后的变

Window Server2016 AD域的创建的方法步骤

《WindowServer2016AD域的创建的方法步骤》本文主要介绍了WindowServer2016AD域的创建的方法步骤,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、准备条件二、在ServerA服务器中常见AD域管理器:三、创建AD域,域地址为“test.ly”

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

Python中使用defaultdict和Counter的方法

《Python中使用defaultdict和Counter的方法》本文深入探讨了Python中的两个强大工具——defaultdict和Counter,并详细介绍了它们的工作原理、应用场景以及在实际编... 目录引言defaultdict的深入应用什么是defaultdictdefaultdict的工作原理

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,