隐马尔科夫模型HMM(四)维特比算法解码隐藏状态序列

在本篇我们会讨论HMM模型最后一个问题的求解,即即给定模型和观测序列,求给定观测序列条件下,最可能出现的对应的隐藏状态序列。在阅读本篇前,建议先阅读这个系列的第一篇以熟悉HMM模型。

HMM模型的解码问题最常用的算法是维特比算法,当然也有其他的算法可以求解这个问题。同时维特比算法是一个通用的求序列最短路径的动态规划算法,也可以用于很多其他问题,比如之前讲到的文本挖掘的分词原理中我们讲到了单独用维特比算法来做分词。

本文关注于用维特比算法来解码HMM的的最可能隐藏状态序列。

在HMM模型的解码问题中,给定模型λ=(A,B,Π)\lambda = (A, B, \Pi)和观测序列O={o1,o2,...oT}O =\{o_1,o_2,...o_T\},求给定观测序列O条件下,最可能出现的对应的状态序列I={i1,i2,...iT}I^*= \{i_1^*,i_2^*,...i_T^*\},即P(IO)P(I^*|O)要最大化。

一个可能的近似解法是求出观测序列OO在每个时刻tt最可能的隐藏状态iti_t^*然后得到一个近似的隐藏状态序列I={i1,i2,...iT}I^*= \{i_1^*,i_2^*,...i_T^*\}。要这样近似求解不难,利用隐马尔科夫模型HMM(二)前向后向算法评估观察序列概率中第五节的定义:在给定模型λ\lambda和观测序列OO时,在时刻tt处于状态qiq_i的概率是γt(i)\gamma_t(i),这个概率可以通过HMM的前向算法与后向算法计算。这样我们有:$$i_t^* = arg \max_{1 \leq i \leq N}[\gamma_t(i)], ; t =1,2,…T$$

近似算法很简单,但是却不能保证预测的状态序列是整体是最可能的状态序列,因为预测的状态序列中某些相邻的隐藏状态可能存在转移概率为0的情况。

而维特比算法可以将HMM的状态序列作为一个整体来考虑,避免近似算法的问题,下面我们来看看维特比算法进行HMM解码的方法。

既然是动态规划算法,那么就需要找到合适的局部状态,以及局部状态的递推公式。在HMM中,维特比算法定义了两个局部状态用于递推。

第一个局部状态是在时刻tt隐藏状态为ii所有可能的状态转移路径i1,i2,...iti_1,i_2,...i_t中的概率最大值。记为δt(i)\delta_t(i):$$\delta_t(i) = \max_{i_1,i_2,…i_{t-1}};P(i_t=i, i_1,i_2,…i_{t-1},o_t,o_{t-1},…o_1|\lambda),; i =1,2,…N$$

δt(i)\delta_t(i)的定义可以得到δ\delta的递推表达式:$$\begin{align} \delta_{t+1}(i) & = \max_{i_1,i_2,…i_{t}};P(i_{t+1}=i, i_1,i_2,…i_{t},o_{t+1},o_{t},…o_1|\lambda) \ & = \max_{1 \leq j \leq N};[\delta_t(j)a_{ji}]b_i(o_{t+1})\end{align}$$

第二个局部状态由第一个局部状态递推得到。我们定义在时刻tt隐藏状态为ii的所有单个状态转移路径(i1,i2,...,it1,i)(i_1,i_2,...,i_{t-1},i)中概率最大的转移路径中第t1t-1个节点的隐藏状态为Ψt(i)\Psi_t(i),其递推表达式可以表示为:$$\Psi_t(i) = arg ; \max_{1 \leq j \leq N};[\delta_{t-1}(j)a_{ji}]$$

有了这两个局部状态,我们就可以从时刻0一直递推到时刻TT,然后利用Ψt(i)\Psi_t(i)记录的前一个最可能的状态节点回溯,直到找到最优的隐藏状态序列。

现在我们来总结下维特比算法的流程:

输入:HMM模型λ=(A,B,Π)\lambda = (A, B, \Pi),观测序列O=(o1,o2,...oT)O=(o_1,o_2,...o_T)

输出:最有可能的隐藏状态序列I={i1,i2,...iT}I^*= \{i_1^*,i_2^*,...i_T^*\}

  1. 进行动态规划递推时刻t=2,3,...Tt=2,3,...T时刻的局部状态:$$\delta_{t}(i) = \max_{1 \leq j \leq N};[\delta_{t-1}(j)a_{ji}]b_i(0_{t}),;i=1,2…N$$$$\Psi_t(i) = arg ; \max_{1 \leq j \leq N};[\delta_{t-1}(j)a_{ji}],;i=1,2…N$$

  2. 计算时刻TT最大的δT(i)\delta_{T}(i),即为最可能隐藏状态序列出现的概率。计算时刻TT最大的Ψt(i)\Psi_t(i),即为时刻TT最可能的隐藏状态。$$P* = \max_{1 \leq j \leq N}\delta_{T}(i)$$$$i_T^* = arg ; \max_{1 \leq j \leq N};[\delta_{T}(i)]$$

  3. 利用局部状态Ψ(i)\Psi(i)开始回溯。对于t=T1,T2,...,1t=T-1,T-2,...,1:$$i_t^* = \Psi_{t+1}(i_{t+1}^*)$$

最终得到最有可能的隐藏状态序列I={i1,i2,...iT}I^*= \{i_1^*,i_2^*,...i_T^*\}

我们的观察集合是:$$V={红,白},M=2$$

我们的状态集合是:$$Q ={盒子1,盒子2,盒子3}, N=3 $$

而观察序列和状态序列的长度为3.

初始状态分布为:$$\Pi = (0.2,0.4,0.4)^T$$

状态转移概率分布矩阵为:

A=(0.50.20.30.30.50.20.20.30.5)A = \left( \begin{array} {ccc} 0.5 & 0.2 & 0.3 \\ 0.3 & 0.5 & 0.2 \\ 0.2 & 0.3 &0.5 \end{array} \right)

观测状态概率矩阵为:

B=(0.50.50.40.60.70.3)B = \left( \begin{array} {ccc} 0.5 & 0.5 \\ 0.4 & 0.6 \\ 0.7 & 0.3 \end{array} \right)

球的颜色的观测序列:$$O={红,白,红}$$

按照我们上一节的维特比算法,首先需要得到三个隐藏状态在时刻1时对应的各自两个局部状态,此时观测状态为1:

δ1(1)=π1b1(o1)=0.2×0.5=0.1\delta_1(1) = \pi_1b_1(o_1) = 0.2 \times 0.5 = 0.1

δ1(2)=π2b2(o1)=0.4×0.4=0.16\delta_1(2) = \pi_2b_2(o_1) = 0.4 \times 0.4 = 0.16

δ1(3)=π3b3(o1)=0.4×0.7=0.28\delta_1(3) = \pi_3b_3(o_1) = 0.4 \times 0.7 = 0.28

Ψ1(1)=Ψ1(2)=Ψ1(3)=0\Psi_1(1)=\Psi_1(2) =\Psi_1(3) =0

现在开始递推三个隐藏状态在时刻2时对应的各自两个局部状态,此时观测状态为2:

δ2(1)=max1j3[δ1(j)aj1]b1(o2)=max1j3[0.1×0.5,0.16×0.3,0.28×0.2]×0.5=0.028\delta_2(1) = \max_{1\leq j \leq 3}[\delta_1(j)a_{j1}]b_1(o_2) = \max_{1\leq j \leq 3}[0.1 \times 0.5, 0.16 \times 0.3, 0.28\times 0.2] \times 0.5 = 0.028

Ψ2(1)=3\Psi_2(1)=3

δ2(2)=max1j3[δ1(j)aj2]b2(o2)=max1j3[0.1×0.2,0.16×0.5,0.28×0.3]×0.6=0.0504\delta_2(2) = \max_{1\leq j \leq 3}[\delta_1(j)a_{j2}]b_2(o_2) = \max_{1\leq j \leq 3}[0.1 \times 0.2, 0.16 \times 0.5, 0.28\times 0.3] \times 0.6 = 0.0504

Ψ2(2)=3\Psi_2(2)=3

δ2(3)=max1j3[δ1(j)aj3]b3(o2)=max1j3[0.1×0.3,0.16×0.2,0.28×0.5]×0.3=0.042\delta_2(3) = \max_{1\leq j \leq 3}[\delta_1(j)a_{j3}]b_3(o_2) = \max_{1\leq j \leq 3}[0.1 \times 0.3, 0.16 \times 0.2, 0.28\times 0.5] \times 0.3 = 0.042

Ψ2(3)=3\Psi_2(3)=3

继续递推三个隐藏状态在时刻3时对应的各自两个局部状态,此时观测状态为1:

δ3(1)=max1j3[δ2(j)aj1]b1(o3)=max1j3[0.028×0.5,0.0504×0.3,0.042×0.2]×0.5=0.00756\delta_3(1) = \max_{1\leq j \leq 3}[\delta_2(j)a_{j1}]b_1(o_3) = \max_{1\leq j \leq 3}[0.028 \times 0.5, 0.0504 \times 0.3, 0.042\times 0.2] \times 0.5 = 0.00756

Ψ3(1)=2\Psi_3(1)=2

δ3(2)=max1j3[δ2(j)aj2]b2(o3)=max1j3[0.028×0.2,0.0504×0.5,0.042×0.3]×0.4=0.01008\delta_3(2) = \max_{1\leq j \leq 3}[\delta_2(j)a_{j2}]b_2(o_3) = \max_{1\leq j \leq 3}[0.028 \times 0.2, 0.0504\times 0.5, 0.042\times 0.3] \times 0.4 = 0.01008

Ψ3(2)=2\Psi_3(2)=2

δ3(3)=max1j3[δ2(j)aj3]b3(o3)=max1j3[0.028×0.3,0.0504×0.2,0.042×0.5]×0.7=0.0147\delta_3(3) = \max_{1\leq j \leq 3}[\delta_2(j)a_{j3}]b_3(o_3) = \max_{1\leq j \leq 3}[0.028 \times 0.3, 0.0504 \times 0.2, 0.042\times 0.5] \times 0.7 = 0.0147

Ψ3(3)=3\Psi_3(3)=3

此时已经到最后的时刻,我们开始准备回溯。此时最大概率为δ3(3)\delta_3(3),从而得到i3=3i_3^* =3

由于Ψ3(3)=3\Psi_3(3)=3,所以i2=3i_2^* =3, 而又由于Ψ2(3)=3\Psi_2(3)=3,所以i1=3i_1^* =3。从而得到最终的最可能的隐藏状态序列为:(3,3,3)(3,3,3)

如果大家看过之前写的文本挖掘的分词原理中的维特比算法,就会发现这两篇之中的维特比算法稍有不同。主要原因是在中文分词时,我们没有观察状态和隐藏状态的区别,只有一种状态。但是维特比算法的核心是定义动态规划的局部状态与局部递推公式,这一点在中文分词维特比算法和HMM的维特比算法是相同的,也是维特比算法的精华所在。

维特比算法也是寻找序列最短路径的一个通用方法,和dijkstra算法有些类似,但是dijkstra算法并没有使用动态规划,而是贪心算法。同时维特比算法仅仅局限于求序列最短路径,而dijkstra算法是通用的求最短路径的方法。

(欢迎转载,转载请注明出处。欢迎沟通交流: liujianping-ok@163.com