小白给小白详解维特比算法(一)

2024-08-26 12:08
文章标签 算法 详解 小白 维特

本文主要是介绍小白给小白详解维特比算法(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

转载自:
https://blog.csdn.net/athemeroy/article/details/79339546

篱笆网络Lattice的最短路径问题

初见HMM求解状态序列用到的维特比算法时,其实内心真的是崩溃的:数不尽的假设和公式,让人头昏脑涨的同时也击溃了自信心。但是仔细研究一下会发现其实问题蛮简单的,本文就致力于尝试用更通俗的方式解释一下维特比算法和它是如何运用在HMM求解状态序列中的,因为我也是刚看个差不多……所以如果有不对的地方请各位直接喷别留情!
(以下部分内容参考了吴军《数学之美》26.1,感谢吴军博士通俗易懂的讲解)

篱笆网络(Lattice)的最短路径问题
这个问题长什么样子?
尝试着回答一下这个问题(就算没办法回答也请先别关闭这个窗口!):
已知下图的篱笆网络,每个节点之间的数字表示相邻节点之间的距离,举个例子来说,如果我走A→B1→C2→D1→E,这个距离是6+6+5+4=21。那么如果让你从A走到E,最短路径是哪一条呢?

image_1c6ojbg349vlhlc1dqk1kc91cac58.png-56.9kB图1

这个问题难在哪里?
好啦不用尝试啦!显然大家都知道,通过穷举的方法是很容易得到最短路径,可是问题就在于如果穷举的话,需要的加法次数不用算你也知道实在是太多啦(每条路径需要计算4次加法,一共3×3×3=27条路径共108次计算)!像这种没几层的篱笆网络也就罢了,如果每层13个节点,一共12层(然而这个规模对于标注问题来说也依然根本不算什么),可想而知那个线有多乱,如果仅仅穷举的话,这个计算量(大致是每条12次计算,一共1312条路径共大约12×1312≈2×1015次计算)怕是超级计算机也吃不消。

为了不直接给公式让大家关掉窗口,我们尝试着一点一点来解决这个问题

简化成这个模样,你总能回答了吧?
如下图,如果我想让你找到A→E的最短路径,就很简单了吧?
image_1c6ojgubs15t3a1dbs15il7as5l.png-16.2kB图2

显然图2上只有三条路径,我们分别计算之后得到最短路径应该是A→D3→E这一条,路程是17。

这个时候请把这个问题和上一个问题做一个对比,同时从相反的方向考虑一下上一个问题:如果我最终想要到达E这个节点,其实无论如何都是要经过D这一层的,那么要是我知道从A到D的每一个节点的最短路径长度(在刚才的图上,我们事实上假设了他们分别是15、14和12),再加上从D的各节点到E的路程就得到了最终路径的长度。

当然我们还需要再多想一点:如果想要真的按照A到E的最短路径来走的话,我们其实不会选择D1和D2这两个节点,因为哪怕(以)A→D2(为例)路径更短(就算是10),但是加上D2→E的距离之后就变得更长了(这时候也是18)。相应的我们也就明白这样一个道理:虽然我们最后没有选择D1和D2这两个节点,但我们是否真的就不需要得到A到他们的最短路径了呢?答案当然是否定的:从刚才的例子我们很容易理解,站在D层的角度来看的话,最终的长度是由“历史”(A到每一个D的长度)和“未来”(每一个D到E的长度)同时决定的,只有同时掌握了“历史”和“未来”,世界才能在我们手中(旁白:你说什么呢)!

当然刚才我们从A到D层的路径是假设出来的,事实上如果我们真的要解决最开始那个问题,我们需要求解这个问题:
image_1c6ojkffu1ngj5mj1fe21ogh1vc162.png-17kB图3

我们就可以知道,最终的最短路径到底走的是哪个D。

下一步我们该干什么?
我们已经明白了,为了确定从哪个D到E才是最短的,我们就必须确定A到每一个D的最短路径。诶?这个问题是不是从哪里见过?

其实这就是所谓的“动态规划”的核心了:子问题几乎是完全一样的,我们只要一个一个解决了子问题(的子问题),最终的问题就迎刃而解了。

为了确定这个问题,我们就需要一个D一个D地去考虑(旁白:???),比如在考虑D1的时候不考虑D2、D3、E等等。把问题简化成这个样子:
image_1c6oo3b798cgkokui21apm1fa36f.png-40kB图4

这个图是不是和图1 非常相似?

然后根据图3的思想,我们把它简化成这个样子:
image_1c6oh39kn1sc6140crspdud9ma37.png-24.8kB图5

这个图是不是和图3非常相似?

问题相应就变成了从A到每一个C的最短路径是多少?

解决了这个问题的话,我们就可以知道,最终如果走了比如D1,前面路过的到底是哪个C

再进一步递推:为了确定到某一个C的最短路径,我们需要确定的就是这个问题:
image_1c6oha3dfjn91eo41juqpcdqe44e.png-20.1kB图6

不不不!聪明的你(O__O”…)一定发现了,这根本算不得什么问题,因为其实它是这样的:
image_1c6ohb3ijleq1c229j889e1o2k4r.png-21.2kB图7

因为我们已经推到最后一步了!从A到每一个B的路径事实上都是已知的,我们只需要把他们加在一起去比较大小就可以了!

别忘了我们的目标是什么:我们事实上是要确认如果最终路过了C1,前面路过的是哪一个B。

从动态规划的角度考虑,假设我们最终的路径能路过C1而我们已经走到了C1,那么可以肯定地说,我们来到C1的路径一定是所有来到C1路径里面最短的那一条(在这个图上看应该是B3)。因为如果我们没有走最短的那一条(比如我们错走成了B1),那么我们只要用更短的那一条(B3)去替换也一样可以走到C1。

别倒立了,我们再从头想一下这个问题!
我们刚才是从最终的E节点倒推考虑的这个问题,这一次我们从A真正的走一遍。

我们是怎么走过来的
我们在每一层M都仅仅需要考虑这样一个问题:

为了到下一个层的某一个确定的节点Ni,我们到底应该从哪一个Mi出发呢?

一旦确定了从哪一个Mi出发,其他的Mj就不在我考虑范围内了。
就像我们刚才说的,只要我能找到去C1应该从B3走,我就不需要考虑其他的到C1的路径了。这样就大大的减少了路径总数。

来,我们从A开始走
A→B
这个没啥说的:6,7,5

我们顺利走到了B层

A→B→C
我们确定到每一个C的节点,应该路过哪一个B:
image_1c6oo9fo41unc1mc46he3ssp1r7c.png-21.2kB
C1:6+5=11, 7+4=11, 5+4=9,最终选择A→B3→C1,抛弃其他到C1的路径,长度9
C2:12 ,10 ,11, 最终选择A→B2→C2,抛弃其他到C2的路径,长度10
C3:15,14,11,最终选择A→B3→C3,抛弃其他到C3的路径,长度11
我们顺利走到了C层,同时得到了到每一个C的最短路程

A(→B)→C→D
我们确定到每一个D的节点,应该路过哪一个C
image_1c6oobrs5k8kjm81plbeskk8e7p.png-32.3kB
D_1:9+7=16,10+5=15,11+5=16,最终选择A→B2→C2→D1,抛弃其他到D1的路径,长度15
D_2:17,14,18,最终选择A→B2→C2→D2,抛弃其他到D2的路径,长度14
D_3:12,13,17,最终选择A→B3→C1→D3,抛弃其他到D3的路径,长度12
我们顺利走到了D层,同时得到了到每一个D的最短路程

A(→B→C)→D→E
我们确定每一个D到最终节点E的路程
image_1c6oplpus1or519sjsdp18cn7kp8j.png-27.4kB
显然最后应该选择D3,完整路径为
A→B3→C1→D3→E
路程为17。抛弃其他所有路径。

这次我们需要算的次数大约是多少呢?
简单来说,从A到B有3条路径,每一条我们需要算到每一个C的最短距离,所以是2(路径加法数)×3(A→B)×3(B→C),只要我们确定了每一个到C的最短距离剩下的事情就可以从C开始考虑了:每一个C需要确定到每一个D的最短距离,最终再加上D到E的距离就搞定了(2(路径加法数)×3(C个数)×3(D个数))。
如果换成是12层,每层最多13节点的话,每推一步的计算量最大规模在132(为了确定从哪一个B来到C,需要对每一个B到每一个C进行一次计算,上述计算每步是32=9次),而因为子问题都是一样的,所以增长是与网络长度成正比的:推进12次也仅仅乘以12而已。当然计算的方式不可能像这样简单乘一乘就搞定,但是可以看得出要比穷举要简单得多了。

We are almost there!
这几乎就是维特比算法了。至于维特比算法更公式化的描述和在隐含马尔科夫过程中的应用,我们下一文再说!

这篇关于小白给小白详解维特比算法(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1108522

相关文章

Python基础文件操作方法超详细讲解(详解版)

《Python基础文件操作方法超详细讲解(详解版)》文件就是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位,文件的核心操作就是读和写,:本文主要介绍Python基础文件操作方法超详细讲解的相... 目录一、文件操作1. 文件打开与关闭1.1 打开文件1.2 关闭文件2. 访问模式及说明二、文件读写1.

详解C++中类的大小决定因数

《详解C++中类的大小决定因数》类的大小受多个因素影响,主要包括成员变量、对齐方式、继承关系、虚函数表等,下面就来介绍一下,具有一定的参考价值,感兴趣的可以了解一下... 目录1. 非静态数据成员示例:2. 数据对齐(Padding)示例:3. 虚函数(vtable 指针)示例:4. 继承普通继承虚继承5.

前端高级CSS用法示例详解

《前端高级CSS用法示例详解》在前端开发中,CSS(层叠样式表)不仅是用来控制网页的外观和布局,更是实现复杂交互和动态效果的关键技术之一,随着前端技术的不断发展,CSS的用法也日益丰富和高级,本文将深... 前端高级css用法在前端开发中,CSS(层叠样式表)不仅是用来控制网页的外观和布局,更是实现复杂交

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

详解C#如何提取PDF文档中的图片

《详解C#如何提取PDF文档中的图片》提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使用,下面我们就来看看如何使用C#通过代码从PDF文档中提取图片吧... 当 PDF 文件中包含有价值的图片,如艺术画作、设计素材、报告图表等,提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使

Android中Dialog的使用详解

《Android中Dialog的使用详解》Dialog(对话框)是Android中常用的UI组件,用于临时显示重要信息或获取用户输入,本文给大家介绍Android中Dialog的使用,感兴趣的朋友一起... 目录android中Dialog的使用详解1. 基本Dialog类型1.1 AlertDialog(

C#数据结构之字符串(string)详解

《C#数据结构之字符串(string)详解》:本文主要介绍C#数据结构之字符串(string),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录转义字符序列字符串的创建字符串的声明null字符串与空字符串重复单字符字符串的构造字符串的属性和常用方法属性常用方法总结摘

Java中StopWatch的使用示例详解

《Java中StopWatch的使用示例详解》stopWatch是org.springframework.util包下的一个工具类,使用它可直观的输出代码执行耗时,以及执行时间百分比,这篇文章主要介绍... 目录stopWatch 是org.springframework.util 包下的一个工具类,使用它

Java进行文件格式校验的方案详解

《Java进行文件格式校验的方案详解》这篇文章主要为大家详细介绍了Java中进行文件格式校验的相关方案,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、背景异常现象原因排查用户的无心之过二、解决方案Magandroidic Number判断主流检测库对比Tika的使用区分zip

Java实现时间与字符串互相转换详解

《Java实现时间与字符串互相转换详解》这篇文章主要为大家详细介绍了Java中实现时间与字符串互相转换的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、日期格式化为字符串(一)使用预定义格式(二)自定义格式二、字符串解析为日期(一)解析ISO格式字符串(二)解析自定义