汉语词与句子切技术及机器翻译评估方法研究
摘要
本论文以统计模型为基础,在参考了大量前人工作的基础上,对汉语词法分
析、口语句子切分和机器翻译评估进行了较为深入的探讨和研究。汉语词法分
析是大部分中文处理的第一步,其重要性不言而喻;句子切分是语音翻译中连
接语音识别和文本翻译的桥梁,无论语音识别和文本翻译单独的效果有多么好,
这座桥没搭好,综合的性能依然无法提高;机器翻译的自动评估是构建机器翻
译系统中很重要的辅助工作,其可以加速翻译系统的开发速度,缩短其开发周
期。简言之,这三方面同属于自然语言处理的基础的研究领域,其效果直接影
响到高层应用的水平。
在词法分析上,我们茅4用隐马尔可夫模型(m心Ⅱ)提出了一种融和了分词、
词性标注和命名实体识别的一体化诃法分析方法。最初我们用基于类别的
HMM,其优点是对词的覆盖面广,系统开销小;缺点是不能精确地预测词的出
现概率。为了提升模型的准确率,我们引入基于词汇的}IMM,并将两者有机地
结合,并用一个“词到字”的概率平滑方法对基于词的HMM进行平滑。实验
结果显示,我们的混合模型由于综合考虑到了字、词、词性以及命名实体的知
识,在切分的准确率和召回率上都明显优于单纯基于类别或者基于词的HMM。
此外在分词系统的实现上,我们借助对通用分词系统APCWS的整体框架和各功
您可能关注的文档
- 明代妇产科的发及其主要成就.pdf
- 明日叶查尔酮对型糖尿病大鼠胰岛细胞损伤的防护作用研究.pdf
- 明代开封城市景价值研究.pdf
- 早期类风湿性关炎三种自身抗体产生与瘀血痹阻证相互关系的临床及实验研究.pdf
- 明清闽南疫病流状况研究.pdf
- 晋唐时期方剂学就与特点研究.pdf
- 普适计算中的室定位算法研究.pdf
- 晕船适应大鼠差表达基因的筛选和鉴定.pdf
- 月华胶囊对主要结核药物肝损害影响及其量效关系的实验研究.pdf
- 木材铣削加工模控制的计算机仿真研究.pdf
- 前端笔试题库及详细答案.docx
- 券商笔试题及详细答案.docx
- 前端面试题原型及详细答案.docx
- 前端数据可视化面试题及详细答案.docx
- 精品解析:天津市滨海区泰达中学2025-2026学年度高二英语第二学期开学考试卷(原卷版).docx
- 精品解析:天津市咸水沽第一中学2025-2026学年度第二学期高二英语第一次月考英语试题(解析版).docx
- 精品解析:天津市武清区杨村第三中学2025~2026学年度第二学期3月质量调查高二年级英语学科试卷(原卷版).docx
- 精品解析:天津市咸水沽第一中学2025-2026学年度第二学期高二英语第一次月考英语试题(原卷版).docx
- 精品解析:天津市和平区天津市第一中学2025-2026学年上学期高三年级英语学科第四次月考试卷(解析版).docx
- 浙江省温州市瑞安市2024-2025学年三年级下册期中考试科学试卷.docx
最近下载
- 2025-2026学年人音版(简谱)初中音乐八年级下册知识点梳理.docx VIP
- 河南省2025年普通高中学业水平合格性考试化学试卷及答案.pdf VIP
- 《矿产资源“三率”指标要求 第5部分:金、银、铌、钽、锂、锆、锶、稀土、锗》(报批稿).pdf VIP
- 2024届山东省青岛市中考一模化学模拟试题(含答案).pdf VIP
- GB50171-2012 电气装置安装工程 盘、柜及二次回路接线施工及验收规范.docx VIP
- JB-T 6396-2006大型合金结构钢锻件 技术条件.pdf
- J B∕T 4323-2019 水基金属清洗剂.pdf VIP
- 项目合作协议最新.pdf VIP
- 大家的日语中级1-24单词.xls VIP
- 蚕变了新模样教学.ppt VIP
原创力文档

文档评论(0)