概率基础——维特比算法

2024-03-12 09:52
文章标签 算法 基础 概率 维特

本文主要是介绍概率基础——维特比算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

概率基础——维特比算法

维特比算法是一种用于求解隐马尔可夫模型(Hidden Markov Model,HMM)解码问题的动态规划算法。它能够高效地找到最有可能产生观测序列的隐藏状态序列,被广泛应用于语音识别、自然语言处理等领域。本篇博客将介绍维特比算法的理论基础以及Python实现,并通过例子解释其在实际问题中的应用。

维特比算法的理论基础

维特比算法通过动态规划的方式,利用前向概率递推地计算每个时刻每个隐藏状态的最大概率路径,从而找到最优的隐藏状态序列。它利用了隐马尔可夫模型的马尔可夫性质和局部最优原则,实现了高效的解码过程。

维特比算法的公式推导

设观测序列为 O = ( o 1 , o 2 , . . . , o T ) O = (o_1, o_2, ..., o_T) O=(o1,o2,...,oT),隐藏状态序列为 Q = ( q 1 , q 2 , . . . , q T ) Q = (q_1, q_2, ..., q_T) Q=(q1,q2,...,qT),模型参数为 λ = ( A , B , π ) \lambda = (A, B, \pi) λ=(A,B,π)

维特比算法的递推公式:

我们定义 δ t ( i ) \delta_t(i) δt(i)为在时刻 t t t处于状态 i i i的最大概率,并定义 ψ t ( i ) \psi_t(i) ψt(i)为在时刻 t t t处于状态 i i i时,前一个状态是什么。递推公式如下:

δ t ( i ) = max ⁡ 1 ≤ j ≤ N [ δ t − 1 ( j ) ⋅ a j i ] ⋅ b i ( o t ) \delta_t(i) = \max_{1 \leq j \leq N}[\delta_{t-1}(j) \cdot a_{ji}] \cdot b_i(o_t) δt(i)=1jNmax[δt1(j)aji]bi(ot)

ψ t ( i ) = arg ⁡ max ⁡ 1 ≤ j ≤ N [ δ t − 1 ( j ) ⋅ a j i ] \psi_t(i) = \arg\max_{1 \leq j \leq N}[\delta_{t-1}(j) \cdot a_{ji}] ψt(i)=arg1jNmax[δt1(j)aji]

其中, N N N表示隐藏状态的数量, a j i a_{ji} aji表示从状态 j j j转移到状态 i i i的概率, b i ( o t ) b_i(o_t) bi(ot)表示在状态 i i i下生成观测值 o t o_t ot的概率。

终止条件:

最终,我们在最后一个时刻 T T T找到最大的 δ T ( i ) \delta_T(i) δT(i)作为最终的最大概率,然后根据 δ T ( i ) \delta_T(i) δT(i) ψ t ( i ) \psi_t(i) ψt(i)回溯找到对应的最优隐藏状态序列。

维特比算法的应用案例

语音识别

在语音识别中,维特比算法用于将声学模型和语言模型结合起来,找到最可能产生输入音频的文字序列。

Python实现

下面通过一个简单的例子,使用Python实现维特比算法对隐马尔可夫模型进行解码,并绘制出最优路径图像。

import numpy as np
import networkx as nx
import matplotlib.pyplot as plt# 定义模型参数
states = ['Healthy', 'Fever']
observations = ['normal', 'cold', 'dizzy']
pi = np.array([0.6, 0.4])  # 初始状态概率分布
A = np.array([[0.7, 0.3],[0.4, 0.6]])  # 隐藏状态转移概率矩阵
B = np.array([[0.5, 0.4, 0.1],[0.1, 0.3, 0.6]])  # 观测状态概率矩阵# 维特比算法
def viterbi(obs, pi, A, B):T = len(obs)N = len(pi)delta = np.zeros((T, N))psi = np.zeros((T, N), dtype=int)# 初始化delta[0] = pi * B[:, obs[0]]# 递推for t in range(1, T):for j in range(N):delta[t, j] = np.max(delta[t - 1] * A[:, j]) * B[j, obs[t]]psi[t, j] = np.argmax(delta[t - 1] * A[:, j])# 终止best_path_prob = np.max(delta[T - 1])best_path_pointer = np.argmax(delta[T - 1])best_path = [best_path_pointer]# 回溯for t in range(T - 2, -1, -1):best_path_pointer = psi[t + 1, best_path_pointer]best_path.insert(0, best_path_pointer)return best_path, best_path_prob# 观测序列
obs = [0, 1, 2]  # normal, cold, dizzy# 解码
best_path, best_path_prob = viterbi(obs, pi, A, B)
print("Best Path:", [states[i] for i in best_path])
print("Probability of Best Path:", best_path_prob)# 绘制最优路径图像
G = nx.MultiDiGraph()
G.add_nodes_from(states)
for i, state in enumerate(states):for j, next_state in enumerate(states):prob = A[i, j]G.add_edge(state, next_state, weight=prob, label='{:.2f}'.format(prob))pos = nx.circular_layout(G)
edge_labels = {(n1, n2): d['label'] for n1, n2, d in G.edges(data=True)}
nx.draw(G, pos, with_labels=True, node_size=1500, node_color='skyblue', font_size=15, arrows=True)
nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels, font_color='red')
plt.title('Hidden Markov Model: Best Path')
plt.show()

在这里插入图片描述

上述代码实现了一个简单的隐马尔可夫模型的维特比算法,并绘制了最优路径图像。我们定义了两个隐藏状态(健康和发烧)、三个观测状态(正常、感冒和头晕)、初始状态概率分布、隐藏状态转移概率矩阵和观测状态概率矩阵。然后,通过使用NetworkX库绘制了最优路径图像。

结论

维特比算法作为一种高效的解码算法,在隐马尔可夫模型中有着重要的应用。通过本文的介绍,我们了解了维特比算法的理论基础以及Python实现。希望本文对您理解维特比算法有所帮助。

这篇关于概率基础——维特比算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/800893

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

dp算法练习题【8】

不同二叉搜索树 96. 不同的二叉搜索树 给你一个整数 n ,求恰由 n 个节点组成且节点值从 1 到 n 互不相同的 二叉搜索树 有多少种?返回满足题意的二叉搜索树的种数。 示例 1: 输入:n = 3输出:5 示例 2: 输入:n = 1输出:1 class Solution {public int numTrees(int n) {int[] dp = new int