- 2
- 0
- 约4.93千字
- 约 29页
- 2017-05-21 发布于四川
- 举报
中文自动分词系统IRSEG设计与实现 高立琦 王卓然 2004.9.20 大纲 中文分词的意义和用途 IRSEG系统框架设计 数学模型与原理分析 “N最短路径”的算法设计 基于局部Bigram模型的未登录词识别模块 系统评测 大纲 中文分词的意义和用途 IRSEG系统框架设计 数学模型与原理分析 “N最短路径”的算法设计 基于局部Bigram模型的未登录词识别模块 系统评测 中文分词的意义和用途 汉语的特点 最小书写单位为字 最小表意单位为词 词与词之间没有书写边界 分词系统的用途 各种中文信息处理系统的基础模块 自然语言处理 信息检索 … 大纲 中文分词的意义和用途 IRSEG系统框架设计 数学模型与原理分析 “N最短路径”的算法设计 基于局部Bigram模型的未登录词识别模块 系统评测 IRSEG系统框架设计 大纲 中文分词的意义和用途 IRSEG系统框架设计 数学模型与原理分析 “N最短路径”的算法设计 基于局部Bigram模型的未登录词识别模块 系统评测 数学模型与原理分析 信道噪声模型 设S=c1c2…cn为输入汉字序列,W=w1w2…wm为切分词序列。 分词系统的任务是,找到一种切分结果W*,满足: 根据贝叶斯公式: 假设:一个词wi的出现概率以它前面的词的出现没有关系(Unigram模型) 则: 为了实现上的方便,我们对上述公式取负对数,得到: 数学模型
您可能关注的文档
最近下载
- 印度哲学关于“无”与“有”的论争——兼论日本“批判佛教”如来藏观“有”的逻辑.pdf VIP
- 福州大学结构复试回忆(1).doc VIP
- ]复试材料(结构工程)福州大学.docx VIP
- 基于PLC的智能鞋柜的设计与开发.doc VIP
- 国外航运政策之新加坡航运政策--第十四周.pdf VIP
- 小学数学巧算24点专项练习题(每日一练,共14份).pdf VIP
- 瓦房店ZWZ轴承型录.pdf VIP
- 2026年春八年级下学期第一次月考试卷道德与法治学情自测卷(全解全析)(湖北专用).docx VIP
- 2025年中级银行从业资格考试《银行业法律法规与综合能力》新版真题卷(附答案).pdf VIP
- 小儿腹泻护理PPT课件含内容版(全文可看).pptx VIP
原创力文档

文档评论(0)