信息论基础:生日问题

2024-04-07 10:36
文章标签 基础 问题 信息论 生日

本文主要是介绍信息论基础:生日问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

生日问题

我的小学同班同学小琦,和我是同一天生日。每次聚会,我俩同时在场时,我们都会向其他人提起这一点。我们觉得这是很幸运的。

这个概率大吗?要回答这样的问题,需要把几个问题区分清楚。

  • 问题1:对于特定的某个同学,他与我生日相同的概率是多少?这个概率是1/365,并不大。
  • 问题2:某班有𝑆个学生,有人与我生日相同的概率是多少?这个概率大约是(𝑆-1)/365,并不小。
  • 问题3:某班有𝑆个学生,至少两个学生生日相同(月和日相同)的概率是多少?

问题3是概率中的生日问题(Birthday Problem)。首先,计算没有人生日相同的概率。为了表达式的含义更明确,用𝐴表示一年的天数365。所有人生日不同的概率为:
P = A ( A − 1 ) ( A − 1 ) . . . ( A − S + 1 ) A S . P = \frac {A(A-1)(A-1) ... (A-S+1)} {A^S}. P=ASA(A1)(A1)...(AS+1).

至少有两人生日相同的概率为1−𝑃。下图绘制了至少两人生日相同的概率(纵坐标)与人数(横坐标)的关系。如果班里有23人,至少有两人生日相同的概率>50%;如果有57人,概率>99%。

如果要和人打赌一个班有没有相同生日的人,只要人数不少于23人,就可以赌有,获胜的概率超过一半。

还有另一个问题。令𝑋表示班里生日相同的对数。𝑋的期望是多少?
E ( X ) = S ( S − 1 ) 2 1 A . E(X) = \frac {S(S-1)} 2 \frac 1 A. E(X)=2S(S1)A1.

生物特征识别也有生日问题。在生物特征系统中,一个人被编码为其的生物特征,例如人像、指纹、虹膜。如果生物特征识别算法认为两个人的生物特征重了,就是发生了错误匹配(False Match)。任意一对生物特征的错误匹配概率(FMR,False Match Rate),类似任意两个人的生日相同概率(1/A)。只要有两个人的生物特征重了,就叫做发生冲突。假设整个系统一共有𝑆人,识别算法的FMR需要多小,才能使冲突概率约为1/2?

不冲突的概率为:
( 1 − F M R ) S ( S − 1 ) 2 = 0.5 (1-FMR)^{\frac {S(S-1)} 2} = 0.5 (1FMR)2S(S1)=0.5
得出:
F M R = 1 − 0. 5 2 S ( S − 1 ) FMR = 1-0.5^ {\frac 2 {S(S-1)}} FMR=10.5S(S1)2

下图绘制了FMR和𝑆的关系,由于两个数字的范围都太大,用对数坐标。从中看出,有1亿人时,冲突概率1/2对应的FMR为 1 0 − 16 10^{-16} 1016

生物特征冲突在大规模身份识别系统中容易出现。因此,大规模身份识别系统对于FMR要求非常高。例如,印度曾经没有全民的身份证,有人根本没有身份,而有人有多重身份,这会带来很多社会问题。后来印度实施了Aadhaar项目,要给每个印度人一个唯一的身份证。印度有14亿多人口,为了保证尽可能低的FMR(因此尽可能低的冲突概率),采集了每个人的人像、十指指纹和一对虹膜。

每当有人来申请身份证,要在所有已经发证的数据库中,进行生物特征查重。当所有人的身份证都办完的时候,14亿人之间就全部做过比对了。一共是 2 × 1 0 18 2 \times 10^{18} 2×1018,200亿亿次比对。这就要求FMR要非常低。

为了降低FMR,Aadhaar项目融合了三种生物特征。实验表明,指纹加虹膜的效果特别有效。在一个大规模的测试库上,融合后的错误率显著下降。

参考文献

  1. A.K. Jain. http://biometrics.cse.msu.edu/Presentations/MBZUAI_Sept_1_2020.pdf

  2. Daugman, John. “Collision avoidance on national and global scales: Understanding and using big biometric entropy.” TechRxiv (2021).

这篇关于信息论基础:生日问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/882364

相关文章

基于.NET编写工具类解决JSON乱码问题

《基于.NET编写工具类解决JSON乱码问题》在开发过程中,我们经常会遇到JSON数据处理的问题,尤其是在数据传输和解析过程中,很容易出现编码错误导致的乱码问题,下面我们就来编写一个.NET工具类来解... 目录问题背景核心原理工具类实现使用示例总结在开发过程中,我们经常会遇到jsON数据处理的问题,尤其是

springboot3.4和mybatis plus的版本问题的解决

《springboot3.4和mybatisplus的版本问题的解决》本文主要介绍了springboot3.4和mybatisplus的版本问题的解决,主要由于SpringBoot3.4与MyBat... 报错1:spring-boot-starter/3.4.0/spring-boot-starter-

在 Spring Boot 中使用异步线程时的 HttpServletRequest 复用问题记录

《在SpringBoot中使用异步线程时的HttpServletRequest复用问题记录》文章讨论了在SpringBoot中使用异步线程时,由于HttpServletRequest复用导致... 目录一、问题描述:异步线程操作导致请求复用时 Cookie 解析失败1. 场景背景2. 问题根源二、问题详细分

解读为什么@Autowired在属性上被警告,在setter方法上不被警告问题

《解读为什么@Autowired在属性上被警告,在setter方法上不被警告问题》在Spring开发中,@Autowired注解常用于实现依赖注入,它可以应用于类的属性、构造器或setter方法上,然... 目录1. 为什么 @Autowired 在属性上被警告?1.1 隐式依赖注入1.2 IDE 的警告:

解决java.lang.NullPointerException问题(空指针异常)

《解决java.lang.NullPointerException问题(空指针异常)》本文详细介绍了Java中的NullPointerException异常及其常见原因,包括对象引用为null、数组元... 目录Java.lang.NullPointerException(空指针异常)NullPointer

Android开发中gradle下载缓慢的问题级解决方法

《Android开发中gradle下载缓慢的问题级解决方法》本文介绍了解决Android开发中Gradle下载缓慢问题的几种方法,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、网络环境优化二、Gradle版本与配置优化三、其他优化措施针对android开发中Gradle下载缓慢的问

关于Nginx跨域问题及解决方案(CORS)

《关于Nginx跨域问题及解决方案(CORS)》文章主要介绍了跨域资源共享(CORS)机制及其在现代Web开发中的重要性,通过Nginx,可以简单地解决跨域问题,适合新手学习和应用,文章详细讲解了CO... 目录一、概述二、什么是 CORS?三、常见的跨域场景四、Nginx 如何解决 CORS 问题?五、基

MySQL安装时initializing database失败的问题解决

《MySQL安装时initializingdatabase失败的问题解决》本文主要介绍了MySQL安装时initializingdatabase失败的问题解决,文中通过图文介绍的非常详细,对大家的学... 目录问题页面:解决方法:问题页面:解决方法:1.勾选红框中的选项:2.将下图红框中全部改为英

Nginx启动失败:端口80被占用问题的解决方案

《Nginx启动失败:端口80被占用问题的解决方案》在Linux服务器上部署Nginx时,可能会遇到Nginx启动失败的情况,尤其是错误提示bind()to0.0.0.0:80failed,这种问题通... 目录引言问题描述问题分析解决方案1. 检查占用端口 80 的进程使用 netstat 命令使用 ss

mybatis和mybatis-plus设置值为null不起作用问题及解决

《mybatis和mybatis-plus设置值为null不起作用问题及解决》Mybatis-Plus的FieldStrategy主要用于控制新增、更新和查询时对空值的处理策略,通过配置不同的策略类型... 目录MyBATis-plusFieldStrategy作用FieldStrategy类型每种策略的作