隐马尔可夫分词器实验报告.pptVIP

下载本文档

26
0
约1.68千字
约 17页
2018-10-12 发布于湖北
举报

隐马尔可夫分词器实验报告.ppt

隐马尔可夫分词器实验报告 Felomeng * 演讲大纲模型参数意义实现方法程序演示一、模型参数意义本例所取参数意义如下： M：总字数 N：总状态数 A：状态转移概率分布 B：每个字的各状态概率分布 Pi（?）：初始概率分布 N的意义根据分词标记位置，分为四种状态：单字成词：前后者有，如：/了/ 词头：前有后无，如：/水利词中：前后皆无，如：十年九旱词尾：前无后有，如：水利/ 注：句子开头的字只有两种状态：单字成词：后面有分词标记，如：仅/ 词头：后面没有有分词标记，如：投资 A的意义单字成词词头词中词尾单字成词可能可能 —— —— 词头 —— —— 可能可能词中 —— —— 可能可能词尾可能可能 —— —— 实际上只有8种可能：单字成词-单字成词、单字成词-词头、词头-词中、词头-词尾、词中-词中、词中-词尾、词尾-词头、词尾-单字成词 B的意义每个字的四种状态的概率分布： Pi的含义句首各状态的概率分布：实现方法：需求分析实现方法：类图实现方法：参数意义 M、N直接使用整型表示； A：用一个类MatrixA表示，其中含有八个属性（即八种可能的转换状态，在训练时统计各转移情况次数）和一个方法（根据A中的统计情况计算A中概率分布，计算后将A中八个属性改为概率分布。 B：用一个字典数据结构存储，便于查找和更新，每个分量用一

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

隐马尔可夫分词器实验报告.pptVIP