- 52
- 0
- 约5.26万字
- 约 70页
- 2019-03-28 发布于上海
- 举报
AbstractKeywords:word
Abstract
Keywords:word sense disambiguation;out—of-vocabulary sense prediction;deep learning;sequence labeling;word embeddings
万方数据
黑龙江大学硕士学位论文目
黑龙江大学硕士学位论文
目 录
中文摘要 I
Abstract . .. . .... . ..II
第l章绪论 ..1
1.1研究背景和意义 一1
1.2国内外研究现状 一2
1.2.1词义消歧研究现状 2
1.2.2汉语词义消歧研究现状 4
1.2.3未登录词词义预测研究现状 6
1.3相关研究存在的主要问题 一6
1.4本文主要研究内容 ..7
1.5本文的组织安排 一9
第2章基于序列标注的汉语词义消歧 10
2.1 引言 lO
2.2基于序列标注的汉语词义消歧任务描述 10
2.3词义消歧的序列标注模型 .11
2.3.1基于最大熵模型的词义消歧 ll
2.3.2基于条件随机场模型的词义消歧 一12
2.4词义消歧特征 13
2.4.1词形特征 ..14
2.4.2词性特征 ..14
2.4.3词义特征 ..1 5
2.4.4特征模板 ..1 7
2.5实验结果与分析 1 8
2.5.1语料库来源及评价指标 ..1 8
2.5.2基于最大熵模型的词义消歧实验结果 ..1 9
万方数据
目录2.5.3基于CRF模型的词义消歧实验结果
目录
2.5.3基于CRF模型的词义消歧实验结果 .20
2.5.4两种模型的词义消歧结果对比与分析 一20
2.6本章小结 .22
第3章基于词向量的汉语词义消歧 23
3.1 引言 .23
3.2基于语义相似度的词义消歧 24
3.2.1基于语义相似度的词义消歧框架 一24
3.2.2歧义词词义候选的缩减 一24
3.2.3词向量的学习 一26
3.2.4基于语义相似度的消歧 一28
3.3基于神经网络最大熵模型的词义消歧 29
3.3.1基于神经网络最大熵模型的消歧框架 一29
3.3.2神经网络最大熵模型 一29
3.3.3词义消歧的特征 一30
3.4词义消歧语料的扩展 30
3.4.1语料扩展消歧框架 一30
3.4.2语料扩展原则 一3 l
3.5实验结果与分析 33
3.5.1语料库来源及评价指标 一33
3.5.2基线系统 一33
3.5.3基于相似度的词义消歧实验结果及分析 一35
3.5.4基于神经网络最大熵模型的实验结果及分析 一37
3.6本章小结 4l
第4章基于词向量的汉语未登录词词义预测 42
4.1 引言 42
4.2汉语未登录词的特点 43
4.3汉语未登录词词义预测问题描述 44
万方数据
黑龙江大学硕士学位论文
黑龙江大学硕士学位论文 4.4汉语未登录词词义候选构造 45
4.4.1基于词性的词义候选构造 ..45
4.4.2基于语素的词义候选构造 一46
4.4.3基于聚类的词义候选构造 一48
4.4.4多方法融合的词义候选构造 ..49
4.5汉语未登录词词义预测 49
4.5.1词向量的学习 一50
4.5.2基于语义相似度的词义预测 ..52
4.6实验结果与分析 52
4.6.1实验数据与测评指标 一52
4.6.2词义候选构造实验结果 一53
4.6.3词义预测实验结果 一54
4.7本章小结 56
结论 57
参考文献 59
致谢 64
攻读硕士学位期间发表的学术论文及参加的科研项目 65
独创性声明 66
万方数据
第1章绪论第1章绪论
第1章绪论
第1章绪论
1.1研究背景和意义
随着人工智能领域的发展,人机沟通存在的对于自然语言的理解仍是疑难问 题,造成困难的原因有很多,但其中一个重要原因是自然语言中词语存在歧义性, 即有多个词义。例如:在“中医出身的她,对中医理论研究的很透彻。”,两个“中 医”的含义却不尽相同。人们可以依据自身的知识储备自行理解并“消除”歧义, 但计算机却无法自行区别两个“中医”,这是由于计算机存储的形式决定了计算机 无法分辨两个“中医”的差异。实际上,这种歧义性对于计算机而言是很难被理解 与处理的。有研究表明[1】:在汉语词典中,多义词所占的比重约为14.8%,然而多 义词在自然语言中出现频率的比重约为42%。由此可知,多义词所占比重虽不重, 但其在自然语言中的使用非常频繁。因此,在自然语言处理领域,针对消除词语歧 义性衍生了一个基本的任务,称为词义消歧。在词义消歧任务的基础上,也衍生了 词义预测等研究词义的任务。词义消歧任务被认为是一个人工智能完全问题【2】,该 问题的解决以人工智能领域的全部困难的突破为前提条件。尽管词义消歧任务难 度大,但其作为自然语言处理的一项基础性工作
您可能关注的文档
- 基于无线网络运动控制系统的研究-电工理论与新技术专业论文.docx
- 基于企业网络的产业集群技术创新扩散过程模式研究-技术经济及管理专业论文.docx
- 基于生育期模型的湖北中稻适宜播期与生产潜力的研究-气象学专业论文.docx
- 基于视频案例的师范生教学技能训练在线支持平台研究-教育技术学专业论文.docx
- 基于遗传—神经网络的电液伺服阀故障模式识别研究-机械设计及理论专业论文.docx
- 基于数据驱动的流程工业性能监控与故障诊断研究-控制科学与工程专业论文.docx
- 基于人力资本产权的企业经营者薪酬制度研究-会计学专业论文.docx
- 基于长江干线AIS的航运信息平台的开发与研究-交通信息工程及控制专业论文.docx
- 基于系统科学的高等教育转型发展研究-管理科学与工程专业论文.docx
- 基于可用性测试的培训类b2c网站设计研究-设计艺术学专业论文.docx
最近下载
- 2026年职业资格房地产经纪人房地产经纪专业基础-房地产经纪职业导论参考题库含答案解析(5卷题有答案.docx VIP
- 部编版道德与法治五年级下册复习资料.pdf VIP
- JCT2559-2020 岩棉外墙外保温系统用粘结、抹面砂浆.pdf VIP
- 外研版(三起)(2024)三年级下册英语Unit 1《Animal friends》教案(共4课时).docx VIP
- 《中华民族共同体概论》第十三讲测试题及答案.docx VIP
- 油田油气集输设计规范宣贯材料PPT.ppt VIP
- 广西桂林市2023-2024学年高一下学期期末质量检测物理试卷(含答案).docx VIP
- 中考数学总复习课件14个专题.ppt VIP
- 气田集输设计规范GB50349-2015知识培训.pptx
- 2025年全面从严治党工作报告 .pdf VIP
原创力文档

文档评论(0)