文章目录
1. HMM概念(观测序列&状态序列)
在学习HMM(隐马尔可夫模型)之前,我们接触最多的就是分类问题和回归问题,其中分类模型如逻辑回归、决策树模型等;回归模型如多元线性回归。除此之外,还有另一类问题,序列标注问题,如词性标注,对于一个样本,输入是一句话,比如“the book is interesting”,预测的是每个词的词性(动词、名词等)。之前学到的逻辑回归和决策树,通常解决的是这一句话属于什么类别,比如在情感分类中,"the book is interesting"整句话被分类成中性。但现在我们需要预测这句话中每个词的类别。这就用到了本章所讲到的HMM模型,因此HMM也被称为时序模型或者说序列模型。后续学习中,也可以使用lstm等模型解决这类问题。本章仅讨论HMM。
还是以刚才"the book is interesting"为例,the对应的词性为介词,book的词性为名词,is对应的词性为系动词,interesting对应的词性为形容词。在语言的世界中我们能够观测到的是这句话,其背后对应的词性是不会被观测到的,或者说是被隐藏的。因此,这里引出了两个新的概念,观测序列和隐藏序列(或者说是