深入浅出談 隐马尔可夫的概念(1/ 2)

2024-06-16 11:20

本文主要是介绍深入浅出談 隐马尔可夫的概念(1/ 2),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、说明
  • 二、Markov Chain
  • 三、Introduction
  • 四、State Sequence
  • 五、Comment
  • 六、介绍隐藏式马可夫法则。
  • 七、隐藏马尔可夫Introduction
  • 八、结论

一、说明

在许多机器学习的章节中,常常遇见 HMM ,往往看到它的数学式子后,就当没看到似的跳过去了,其实它的基础理论并不难,尤其是 Markov Chain 在高中数学课本就已经出现过了,但…那么久远的事,相信大家都忘得差不多了,现在一起来回顾一下吧!!

二、Markov Chain

在状态空间中,了解当前的状态与下一个状态发生的随机过程。
(疴…有讲等于没讲,来看一下 Key point 吧! )

Key point:
如左下图,现有三间大型卖场在AIA附近,分别是Costco、爱买、大润发,已知顾客今日在各个卖场间流动的固定几率(invariant),亦即图上的数字,值得注意的是,从每间卖场画出去箭头上的数字相加起来为1 (ex: Costco 0.7+0.2+1 = 1)。 接着来看一下范例吧…
在这里插入图片描述

今天刚来AIA报到的学员圆仔,看到卖场广告后,会到三间卖场的机率分别为0.5、0.1、0.4,那么上课第三天圆仔会到Costco逛的机率是多少? (解法如下)

在这里插入图片描述
在这里插入图片描述

三、Introduction

透过上述例子可以知道,当前的状态跟上一个状态有关,是不是有些感觉了咧? 接下来,就跟着一起走进数学的世界吧!!!

符号介绍:
•假设有 N 个状态,分别标示为 s₁, s₂, …, s_N
•假设从当前状态 si 变成 sj 的机率为 aij,可表示成转移矩阵(Transition Matrix) A,如下…
在这里插入图片描述

•我们纪录第 t 秒的状态在第 i 个状态为 qt = i
•起始时间选定某个状态 si 的机率为 πi ,又可标为 P(q₀ = j)

四、State Sequence

一开始我们会选定一个起状态,然后每过一个单位时间,就会选择走过某一条与当下状态相关的边,到达下一个状态,经过 T 秒后,我们就会得到一条有 T 条边、 T+1 个状态的有序路径(亦称之,state sequence)。
在这里插入图片描述

如果上述说的实在抽象,我们用3个状态、5个时间单位说明吧! 如左图和表格,我们经过5个时间点,会得到6个状态的一条路径,因此我们可以算得形成这条路径的机率是多少?

机率 = π₁ a₁₃ a₃₂ a₂₂ a₂₁ a₁₃

上述的例子,应该可以让大家比较有深刻的感触吧! 不免俗的,还是用数学式子写一下…在有 T 个时间单位下…我们会得到 state sequence Q
在这里插入图片描述

最后,可以得到 Q 的机率为

在这里插入图片描述

五、Comment

在固定状态转换 (invariant)的机率下,一切如上述,似乎单纯,如果我们再加入一些变动因素,举两个常见的例子来看看啦!

(1)学员圆仔每日到卖场的机率,会加入他当日出差路线而有异动,即是与时间相关的非固定状态 (time variant)啦! 其实也没那么复杂,底下的图,让你秒懂这一切。
在这里插入图片描述

(2)学员圆仔每日到某卖场的机率,会受到前一日或是前两日去过哪间卖场的影响,前者称为 first-order,后者称为 second-order,听起来很难,其实也没什么,图画出来就知道简单了。

在这里插入图片描述

这些东西到底哪时候才会用到呢? 只要有时间关系的,例如,RNN、NLP、RL,都可以用 Markov chain 的变化形态来解释喔!

下一章 Hidden Markov Model_part2 会带大家认识闻风丧胆的「Hidden Markov Model」,敬请期待吧!!

六、介绍隐藏式马可夫法则。

Key point:
我们用 part 1 的例子做延伸,如下图,每天都有一定的机率到某间卖场里购物,同时也会有某个机率在该间卖场买瓶饮料。

在这里插入图片描述
在起始机率分别为0.5、0.1、0.4下,圆仔三天来逛卖场的顺序为Q(爱买,Costco, 大润发),每到一间卖场他都会买一瓶饮料,三天来分别买了O(雪碧,可乐,绿茶),请问发生Q和O的共同机率为多少呢?
在这里插入图片描述
现在换个问题来想想,如果已知连续三天到卖场买的饮料依序为O(红茶,雪碧,绿茶),请问有几种可能路线呢? 每条路线分别发生的机率又有多少呢?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

七、隐藏马尔可夫Introduction

第二个例子说明了,当只知观察值,而状态被隐藏的时候,如何找出「最佳的路径」。 但是,既然是 model 一定是需要训练的,到底什么东西是需要被训练的呢?
在实际遇到的问题中,我们并不会知道「机率转移矩阵」实际的机率是多少,换句话说,我们不知道上述所指的 「转移矩阵 A」和「转移矩阵 B」,只会有一堆数据。
在此,我们用已知的转移矩阵条件下,举一个实际的分类问题,熊猫团团、圆圆、圆仔,半年来,每周买饮料(观察值)的依序清单,至于可能的路线,及多少机率会买到对应的饮料,皆是未知,根据个别的买卖习惯分析,训练对应的模型,找出对应的「转移矩阵」,最后我们要预测,当随便给一周的饮料的清单,最有可能是哪只熊猫的喜好。

在这里插入图片描述
(上图为 HMM,其中一种方法,目的试算出在指定事件的发生状态下,算出此事件发生的最大机率之路径 )

八、结论

HMM模型特点:

  1. HMM 是针对有关时间序列的数据所建立的模型。
  2. 是所有时间模型的鼻祖 (ex: RNN、NLP、RL 等)

讲到这边,大家对于 HMM 能处理的问题,应该有所认识了,part 3 将会带大家了解要如何训练 model ,找出可能的状态栏,不过这部分有很多的数学式在里面,千万别看到就头晕了,所以慎入呀

这篇关于深入浅出談 隐马尔可夫的概念(1/ 2)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1066322

相关文章

【VUE】跨域问题的概念,以及解决方法。

目录 1.跨域概念 2.解决方法 2.1 配置网络请求代理 2.2 使用@CrossOrigin 注解 2.3 通过配置文件实现跨域 2.4 添加 CorsWebFilter 来解决跨域问题 1.跨域概念 跨域问题是由于浏览器实施了同源策略,该策略要求请求的域名、协议和端口必须与提供资源的服务相同。如果不相同,则需要服务器显式地允许这种跨域请求。一般在springbo

【MRI基础】TR 和 TE 时间概念

重复时间 (TR) 磁共振成像 (MRI) 中的 TR(重复时间,repetition time)是施加于同一切片的连续脉冲序列之间的时间间隔。具体而言,TR 是施加一个 RF(射频)脉冲与施加下一个 RF 脉冲之间的持续时间。TR 以毫秒 (ms) 为单位,主要控制后续脉冲之前的纵向弛豫程度(T1 弛豫),使其成为显著影响 MRI 中的图像对比度和信号特性的重要参数。 回声时间 (TE)

计算机网络基础概念 交换机、路由器、网关、TBOX

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、VLAN是什么?二 、交换机三、路由器四、网关五、TBOXTelematics BOX,简称车载T-BOX,车联网系统包含四部分,主机、车载T-BOX、手机APP及后台系统。主机主要用于车内的影音娱乐,以及车辆信息显示;车载T-BOX主要用于和后台系统/手机APP通信,实现手机APP的车辆信息显示与控

01 Docker概念和部署

目录 1.1 Docker 概述 1.1.1 Docker 的优势 1.1.2 镜像 1.1.3 容器 1.1.4 仓库 1.2 安装 Docker 1.2.1 配置和安装依赖环境 1.3镜像操作 1.3.1 搜索镜像 1.3.2 获取镜像 1.3.3 查看镜像 1.3.4 给镜像重命名 1.3.5 存储,载入镜像和删除镜像 1.4 Doecker容器操作 1.4

【机器学习-一-基础概念篇】

机器学习 定义分类算法 应用 定义 机器学习最早是被Arthur Samuel 提出的一个概念,指计算机无需明确编程即可学习的研究领域。1950年他发明的跳棋程序,这个人机对弈游戏让他的声名鹊起,机器学习这个概念才进入大众的是视线。 在这个跳棋程序里,他编程了一种算法,这个程序与Arthur下了数万次跳棋,计算机逐渐学会了下在哪里有更大的可能会赢得比赛,哪里会输,通过这种方法,最

【吊打面试官系列-Redis面试题】说说 Redis 哈希槽的概念?

大家好,我是锋哥。今天分享关于 【说说 Redis 哈希槽的概念?】面试题,希望对大家有帮助; 说说 Redis 哈希槽的概念? Redis 集群没有使用一致性 hash,而是引入了哈希槽的概念,Redis 集群有 16384 个哈希槽,每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽, 集群的每个节点负责一部分 hash 槽。

AI辅助编程里的 Atom Group 的概念和使用

背景 在我们实际的开发当中,一个需求往往会涉及到多个文件修改,而需求也往往有相似性。 举个例子,我经常需要在 auto-coder中需要添加命令行参数,通常是这样的: /coding 添加一个新的命令行参数 --chat_model 默认值为空 实际上这个需求涉及到以下文件列表: /Users/allwefantasy/projects/auto-coder/src/autocoder/auto

读软件设计的要素04概念的关系

1. 概念的关系 1.1. 概念是独立的,彼此间无须相互依赖 1.1.1. 一个概念是应该独立地被理解、设计和实现的 1.1.2. 独立性是概念的简单性和可重用性的关键 1.2. 软件存在依赖性 1.2.1. 不是说一个概念需要依赖另一个概念才能正确运行 1.2.2. 只有当一个概念存在时,包含另一个概念才有意义 1.3. 概念依赖关系图简要概括了软件的概念和概念存在的理

【生物信息学算法】图算法1:概念和算法

文章目录 1. 图的定义、分类、表达方式图的定义图的分类表达方式Python实现 2.相邻节点和度概念定义python实现 3.路径、距离和搜索路径和距离搜索环 4.图论中的欧拉定理 1. 图的定义、分类、表达方式 图的定义 图G可以由两个集合来定义,即G=(V,E)。其中,V是对象的集合,称为图的顶点或节点; E是V中(u,v)顶点对的集合,称为边或弧,表示u和v之间的关系

数据库系统原理概念整理(备考)

基本概念 数据模型 描述数据的概念和工具 关系数据模型 用关系描述数据 数据模型 包含三个方面 结构 操作 约束 对应于 关系数据模型 关系(表) 关系代数 主外键约束,断言 逻辑数据模型:详尽的描述数据,不关心具体的物理层实现,如关系数据模型中,设计实体及实体间的关系,属性,约束等等。业务逻辑的体现。 逻辑模型 --------查询处理----------物理模型 逻辑方面:SQL结构化查询