信息论基础:生日问题

2024-04-07 10:36
文章标签 基础 问题 信息论 生日

本文主要是介绍信息论基础:生日问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

生日问题

我的小学同班同学小琦,和我是同一天生日。每次聚会,我俩同时在场时,我们都会向其他人提起这一点。我们觉得这是很幸运的。

这个概率大吗?要回答这样的问题,需要把几个问题区分清楚。

  • 问题1:对于特定的某个同学,他与我生日相同的概率是多少?这个概率是1/365,并不大。
  • 问题2:某班有𝑆个学生,有人与我生日相同的概率是多少?这个概率大约是(𝑆-1)/365,并不小。
  • 问题3:某班有𝑆个学生,至少两个学生生日相同(月和日相同)的概率是多少?

问题3是概率中的生日问题(Birthday Problem)。首先,计算没有人生日相同的概率。为了表达式的含义更明确,用𝐴表示一年的天数365。所有人生日不同的概率为:
P = A ( A − 1 ) ( A − 1 ) . . . ( A − S + 1 ) A S . P = \frac {A(A-1)(A-1) ... (A-S+1)} {A^S}. P=ASA(A1)(A1)...(AS+1).

至少有两人生日相同的概率为1−𝑃。下图绘制了至少两人生日相同的概率(纵坐标)与人数(横坐标)的关系。如果班里有23人,至少有两人生日相同的概率>50%;如果有57人,概率>99%。

如果要和人打赌一个班有没有相同生日的人,只要人数不少于23人,就可以赌有,获胜的概率超过一半。

还有另一个问题。令𝑋表示班里生日相同的对数。𝑋的期望是多少?
E ( X ) = S ( S − 1 ) 2 1 A . E(X) = \frac {S(S-1)} 2 \frac 1 A. E(X)=2S(S1)A1.

生物特征识别也有生日问题。在生物特征系统中,一个人被编码为其的生物特征,例如人像、指纹、虹膜。如果生物特征识别算法认为两个人的生物特征重了,就是发生了错误匹配(False Match)。任意一对生物特征的错误匹配概率(FMR,False Match Rate),类似任意两个人的生日相同概率(1/A)。只要有两个人的生物特征重了,就叫做发生冲突。假设整个系统一共有𝑆人,识别算法的FMR需要多小,才能使冲突概率约为1/2?

不冲突的概率为:
( 1 − F M R ) S ( S − 1 ) 2 = 0.5 (1-FMR)^{\frac {S(S-1)} 2} = 0.5 (1FMR)2S(S1)=0.5
得出:
F M R = 1 − 0. 5 2 S ( S − 1 ) FMR = 1-0.5^ {\frac 2 {S(S-1)}} FMR=10.5S(S1)2

下图绘制了FMR和𝑆的关系,由于两个数字的范围都太大,用对数坐标。从中看出,有1亿人时,冲突概率1/2对应的FMR为 1 0 − 16 10^{-16} 1016

生物特征冲突在大规模身份识别系统中容易出现。因此,大规模身份识别系统对于FMR要求非常高。例如,印度曾经没有全民的身份证,有人根本没有身份,而有人有多重身份,这会带来很多社会问题。后来印度实施了Aadhaar项目,要给每个印度人一个唯一的身份证。印度有14亿多人口,为了保证尽可能低的FMR(因此尽可能低的冲突概率),采集了每个人的人像、十指指纹和一对虹膜。

每当有人来申请身份证,要在所有已经发证的数据库中,进行生物特征查重。当所有人的身份证都办完的时候,14亿人之间就全部做过比对了。一共是 2 × 1 0 18 2 \times 10^{18} 2×1018,200亿亿次比对。这就要求FMR要非常低。

为了降低FMR,Aadhaar项目融合了三种生物特征。实验表明,指纹加虹膜的效果特别有效。在一个大规模的测试库上,融合后的错误率显著下降。

参考文献

  1. A.K. Jain. http://biometrics.cse.msu.edu/Presentations/MBZUAI_Sept_1_2020.pdf

  2. Daugman, John. “Collision avoidance on national and global scales: Understanding and using big biometric entropy.” TechRxiv (2021).

这篇关于信息论基础:生日问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/882364

相关文章

关于MongoDB图片URL存储异常问题以及解决

《关于MongoDB图片URL存储异常问题以及解决》:本文主要介绍关于MongoDB图片URL存储异常问题以及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录MongoDB图片URL存储异常问题项目场景问题描述原因分析解决方案预防措施js总结MongoDB图

SpringBoot项目中报错The field screenShot exceeds its maximum permitted size of 1048576 bytes.的问题及解决

《SpringBoot项目中报错ThefieldscreenShotexceedsitsmaximumpermittedsizeof1048576bytes.的问题及解决》这篇文章... 目录项目场景问题描述原因分析解决方案总结项目场景javascript提示:项目相关背景:项目场景:基于Spring

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

《解决Maven项目idea找不到本地仓库jar包问题以及使用mvninstall:install-file》:本文主要介绍解决Maven项目idea找不到本地仓库jar包问题以及使用mvnin... 目录Maven项目idea找不到本地仓库jar包以及使用mvn install:install-file基

usb接口驱动异常问题常用解决方案

《usb接口驱动异常问题常用解决方案》当遇到USB接口驱动异常时,可以通过多种方法来解决,其中主要就包括重装USB控制器、禁用USB选择性暂停设置、更新或安装新的主板驱动等... usb接口驱动异常怎么办,USB接口驱动异常是常见问题,通常由驱动损坏、系统更新冲突、硬件故障或电源管理设置导致。以下是常用解决

Mysql如何解决死锁问题

《Mysql如何解决死锁问题》:本文主要介绍Mysql如何解决死锁问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录【一】mysql中锁分类和加锁情况【1】按锁的粒度分类全局锁表级锁行级锁【2】按锁的模式分类【二】加锁方式的影响因素【三】Mysql的死锁情况【1

SpringBoot内嵌Tomcat临时目录问题及解决

《SpringBoot内嵌Tomcat临时目录问题及解决》:本文主要介绍SpringBoot内嵌Tomcat临时目录问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录SprinjavascriptgBoot内嵌Tomcat临时目录问题1.背景2.方案3.代码中配置t

SpringBoot使用GZIP压缩反回数据问题

《SpringBoot使用GZIP压缩反回数据问题》:本文主要介绍SpringBoot使用GZIP压缩反回数据问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录SpringBoot使用GZIP压缩反回数据1、初识gzip2、gzip是什么,可以干什么?3、Spr

Android Mainline基础简介

《AndroidMainline基础简介》AndroidMainline是通过模块化更新Android核心组件的框架,可能提高安全性,本文给大家介绍AndroidMainline基础简介,感兴趣的朋... 目录关键要点什么是 android Mainline?Android Mainline 的工作原理关键

如何解决idea的Module:‘:app‘platform‘android-32‘not found.问题

《如何解决idea的Module:‘:app‘platform‘android-32‘notfound.问题》:本文主要介绍如何解决idea的Module:‘:app‘platform‘andr... 目录idea的Module:‘:app‘pwww.chinasem.cnlatform‘android-32

kali linux 无法登录root的问题及解决方法

《kalilinux无法登录root的问题及解决方法》:本文主要介绍kalilinux无法登录root的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录kali linux 无法登录root1、问题描述1.1、本地登录root1.2、ssh远程登录root2、