备案控制台

开发者社区 ModelScope模型即服务文章正文

Machine Learning-L18-隐马尔可夫模型

2022-11-22 180

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型训练 PAI-DLC，5000CU*H 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

交互式建模 PAI-DSW，每月250计算时 3个月

简介： Machine Learning-L18-隐马尔可夫模型

隐马尔可夫模型（HMM，Hidden Markov model）是关于时序的概率模型，描述由隐藏马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序列的过程。

隐马尔可夫模型属于动态贝叶斯网，可用于标注问题的模型学习，属于生成模型，在语音识别、自然语言处理，生物信息等领域有着广泛应用。

1. 基本概念

1.1 标注问题

标注（Tagging）问题是分类问题的推广，又是更复杂的结构预测（structure prediction）问题的简单形式。

输入：观测序列
输出：标记序列或状态序列
目的：学习一个模型，使其能够对观测序列给出标记序列作为预测

标注问题针对训练集D ，

输入观测序列：

n是序列的长度，m 为样本个数，n < < m

学习一个模型（条件概率分布）：

使得对于一个新的观测序列：

找到使条件概率

最大的标记序列

1.2 马尔可夫链

随机过程x ( t )，在t tt时刻的状态i _t，仅与t − 1时刻的状态i _t-1 有关，即P (i _t∣ i _t − 1 , . . . i ₁) = P ( i _t ∣ i _t − 1 ) , ,t=1,2,...T，该过程称为马尔可夫过程（Markov Process），又称马尔可夫链（Markov Chain）。

上图为一个马尔可夫链，可以看出

1.3 隐马尔可夫模型

隐藏的马尔可夫链随机生成的状态的序列，称为状态序列（state sequence）；

每个状态生成一个观测，由此产生的观测的随机序列，称为观测序列（observation sequence）；

序列的每个位置为一个时刻。

状态集合：Q = { q₁, q₂ , . . . , q_n }，N是可能的状态数。

观测集合：V = { v₁ ,v₂ , . . . , v_m } ，M 是可能的观测数。

状态序列：I = ( i₁ ,i₂ , . . . , i_t )，T 是状态序列的长度。

观测序列：O = ( o₁, o₂, . . . , o_t

（1）定义

隐马尔可夫模型λ由状态转移概率分布矩阵A 、观测概率矩阵B 及初始概率分布向量π确定，可表示为λ = ( A , B , π )。π和A 决定状态序列，B决定观测序列。

状态转移概率矩阵，其中

是t 时刻q_i状态下转移到t + 1 时刻q_j状态的概率。

观测概率矩阵其中

是t 时刻q_j 状态下生成观测v_k的概率。

初始状态概率向量π = ( π i ) ，其中π i = P ( i 1 = q i ) , i = 1 , 2 , . . . , N

是t = 1 时刻处于状态q i 的概率。

根据定义，观测序列O = (o₁, o₂ , . . . , o_t) 的生成过如下：

Step1: 按照初始状态分布π产生状态i 1

Step2: 令t = 1

Step3: 按照状态i t 的观测概率分布b i _t ( k )生成o tStep4: 按照状态i _t的转移概率分布{ a _it,i _t + 1 } 产生状态i _t + 1

Step5: 令t = t + 1 ，若t < T ，转至Step3；否则，终止

（2）两个基本假设

由定义可知，隐马尔可夫模型有两个基本假设：

齐次马尔可夫性假设：隐藏马尔可夫链任意t tt时刻的状态i _t 只依赖于t − 1 时刻的状态i _t-1 ，与其他时刻的状态及观测无关，也与时刻t 无关，即

观测独立性假设：任意t tt时刻的观测o _t只依赖于该时刻的马尔可夫链的状态o _t ，与其他观测即状态无关，即

1.4 E.g.

按如下步骤，产生颜色序列：

Step1：从4个盒子中等概率选取1个盒子，然后随机抽出1个球，记录颜色并放回

Step2：按照如下规则选择盒子，从选定的盒子中抽出1个球，记录颜色并放回

如果当前盒子是A：直接选择盒子B

如果当前盒子是B或C：以0.4概率转移到左边盒子，0.6的概率转移到右边盒子

如果当前盒子是D：以0.5的概率停留在盒子D，0.5的概率转移到盒子C

即按照如下马尔可夫链选择盒子：

如此重复T TT次，得到颜色的观测序列。

该例子为一个隐马尔可夫模型，有两个随机序列：

状态序列：盒子的序列（隐藏的），长度为T

观测序列：颜色的观测序列（可观测的），长度为T TT

状态集合：Q = { A , B , C , D } ，状态数N = 4

观测集合：V = { 红，白 } ，观测数M = 2

初始概率分布：π = ( 0.25 , 0.25 , 0.25 , 0.25 )

状态转移概率分布：

观测概率分布

其中，

表示t 时刻，B盒状态下生成观测为红球的概率为0.3。

2. 三个基本问题

2.1 概率计算问题

已知模型λ = ( A , B , π )和观测序列O = (o₁, o₂ , . . . , o _t) ，计算在模型λ下观测序列O 出现的概率P ( O ∣ λ )。采用前向（forward）与后向（backward）算法。

2.2 学习问题

已知观测序列O =(o₁, o₂ , . . . , o _t) ，估计模型参数( A , B , π ) ，即使得该模型下观测序列产生的概率P ( O ∣ λ ) 最大，可使用极大似然估计法估计参数。

如果将观测序列看做观测数据O ，而状态序列看做不可观测的隐数据I ，则隐马尔可夫模型可看做是一个含有隐变量的概率模型

可使用EM算法（Baum-Welch算法）实现隐马尔可夫模型的训练。

2.3 预测问题

已知模型λ = ( A , B , π ) 和观测序列O = (o₁, o₂ , . . . , o _t) ，计算使得条件概率P ( I ∣ O ) 最大的状态序列I =(i₁, i₂ , . . . , i_t) ，即给定观测序列，求对应的最可能的状态序列，又称解码问题。

维比特算法应用动态规划搞笑求解最优路径，即概率最大的状态路径。

文章标签：

语音技术

自然语言处理

BI

算法

机器学习Zero

目录

相关文章

游客i66wb7w7cg4tk

|

7月前

|

机器学习/深度学习数据采集人工智能

Machine Learning机器学习之贝叶斯网络(BayesianNetwork)

Machine Learning机器学习之贝叶斯网络(BayesianNetwork)

游客i66wb7w7cg4tk

1291 0 1

机器学习Zero

|

机器学习/深度学习算法 vr&ar

Machine Learning-L19-条件随机场

Machine Learning-L19-条件随机场

机器学习Zero

96 0 2

Machine Learning-L19-条件随机场

游客nekoul5qfopxi

|

机器学习/深度学习自然语言处理算法

机器学习算法之——隐马尔可夫模型(Hidden Markov Models,HMM)

隐马尔可夫模型（Hidden Markov Model，HMM）是结构最简单的动态贝叶斯网，这是一种著名的有向图模型，主要用于时序数据建模（语音识别、自然语言处理等）。

游客nekoul5qfopxi

496 0 0

机器学习算法之——隐马尔可夫模型(Hidden Markov Models,HMM)

机器学习Zero

|

人工智能算法关系型数据库

Machine Learning-L17-贝叶斯网络

Machine Learning-L17-贝叶斯网络

机器学习Zero

285 0 0

Machine Learning-L17-贝叶斯网络

机器学习Zero

|

机器学习/深度学习自然语言处理算法

Machine Learning-L20-降维

Machine Learning-L20-降维

机器学习Zero

163 0 0

Machine Learning-L20-降维

机器学习Zero

|

算法

Machine Learning-L5-回归分析

Machine Learning-L5-回归分析

机器学习Zero

108 0 0

Machine Learning-L5-回归分析

机器学习Zero

|

机器学习/深度学习自然语言处理算法

Machine Learning-L16-概率图模型

Machine Learning-L16-概率图模型

机器学习Zero

206 0 0

Machine Learning-L16-概率图模型

机器学习Zero

|

人工智能 BI

Machine Learning-L2-数据特征

Machine Learning-L2-数据特征

机器学习Zero

140 0 0

Machine Learning-L2-数据特征

机器学习Zero

|

机器学习/深度学习算法 Python

Machine Learning-L6-逻辑回归

Machine Learning-L6-逻辑回归

机器学习Zero

87 0 0

Machine Learning-L6-逻辑回归

机器学习Zero

|

存储编解码算法

Machine Learning-L14-聚类（下）

Machine Learning-L14-聚类（下）

机器学习Zero

278 0 0

Machine Learning-L14-聚类（下）

ModelScope模型即服务

热门文章

最新文章

阿里云通义千问向全社会开放！

multi-agent：多角色Agent协同合作，高效完成复杂任务

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

自然语言处理Transformer模型最详细讲解（图解版）

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

ConsisID：北大联合鹏城实验室等机构推出的文本到视频生成模型

通义千问72B、1.8B、Audio模型开源！魔搭社区最佳实践来啦！

vanna+qwen实现私有模型的SQL转换

ModelScope一键部署模型：新手村实操FAQ篇

【机器学习】集成学习——Stacking模型融合（理论+图解）

CodeFuse「编码挑战季」：冲刺最后1个月！MelGeek磁轴键盘、Beats耳机等你来拿~

Director：构建视频智能体的 AI 框架，用自然语言执行搜索、编辑、合成和生成等复杂视频任务

SPDL：Meta AI 推出的开源高性能AI模型数据加载解决方案，兼容主流 AI 框架 PyTorch

EXAONE 3.5：LG 推出的开源 AI 模型，采用 RAG 和多步推理能力降低模型的幻觉问题

DrivingDojo：中科院联合美团推出的自动驾驶数据集，包含视频片段、驾驶操作和驾驶知识

DeepSeek-V2.5-1210 在线开放使用！支持联网搜索，在各大领域的表现得到全面提升

VISION XL：支持四倍超分辨率的 AI 视频修复处理工具，提供去除模糊、修复缺失等功能

ClotheDreamer：上海大学联合腾讯等高校推出的3D服装生成技术

Florence-VL：微软和马里兰大学共同开源的多模态大语言模型

OOTDiffusion：开源AI虚拟试衣工具，智能适配性别和体型自动调整衣物

相关电子书

更多

DEGREE: Deep Learning For Graph Embedding

Supervised similarity:Learning

Graph Neural Networks- Combing Deep Learning & Symbolic Reasoning

相关实验场景

更多

如何快速训练大模型

下一篇

阿里云无影云电脑免费试用，最长可试用3个月