- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文信息处理中歧义问题分析
中文信息处理中的歧义问题分析
摘 要 中文内容中的歧义问题一直都是语言学中的一个重点研究内容,同时也是将中文语言与计算机信息处理技术相互融合的一个难点所在。随着我们对中文信息处理相关问题的深入研究,我们也逐渐发现了新的问题。这给中文信息化处理工作带来了极大的障碍。为了更好地理解并有效地解决这一问题,我们将中文信息处理中存在的问题专门拿出来进行探讨。通过对歧义问题的处理,从而就目前存在的歧义的原因进行分析并提出相关消除歧义的方式方法。
关键词 中文信息处理;歧义问题;分析
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2017)190-0058-02
人们将信息技术的发展引入到与中文信息的处理中,不仅能够有效地提升工作效率,同时还能够更好的对中文进行研究。然而在实践过程中我们发现,虽然信息技术能够很好的对中文进行信息转换,然而在面对中文中存在的歧义问题时,仍然会出现一些问题。比如在特定的中文信息环境中,对语言信息的处理不恰当的现象。虽然这种歧义一直存在,但是它产生的影响相对较小。主要原因在于人们会自发的通过语言环境,背景以及常识进行有效地结合。从而在不同的歧义含义中找出最为正确的答案。相较于信息技术对于中文信息处理中存在的歧义,正是缺乏这种环境、背景、常识的引入所导致的。因此,我们可以通过这种方式来寻找解决方法。从而帮助计算机在处理中文信息的过程中减少歧义问题的发生。
1 中文信息处理的概念
关于中文信息处理的概念性的表述可以理解为通过使用计算机的信息技术来将中文中涉及到发音、字形以及含义等相关信息的内容进行处理和加工的方式[1]。中文信息处理方式是综合了语言学、计算机信息技术、声学等多种学科的综合性的技术概念。通过将计算机信息技术引入到中文研究中,不仅有效地提高了对中文的含义表述的工作效率,同时还能够实现多方面、多层次的处理手段,从而使中文的表述以及含义理解更加具体。
2 中文信息处理中对歧义问题研究的发展
随着在中文信息处理过程中歧义问题的不断发生,对于“消歧”的工作也逐渐受到更多的重视,尤其是在信息技术发展的迅猛阶段[2]。对于“消歧”工作的科研学术报告已达到近百篇。不难看出,自从对于信息处理过程中的歧义有了定义后,“消歧”工作的研究和开展已呈现出一个明显的上升趋势[3]。同时,“消歧”的研究内容也在不断的拓展,从中文内容中的各个方面开始逐步进行了研究。使研究内容不仅具有全面性更有交叉性。
3 目前存在的主要歧义问题
通过对中文信息处理过程中的歧义问题的分析,在对歧义问题进行研究和探讨时,我们通常会将中文中的歧义问题以其具体发生歧义的情况为准,分为:结构歧?x、词义歧义、分词歧义、其他类型以及不明确限定的歧义类型。在其他类型的分类中还包含着对于词语词性的歧义分析、短语边界的词义分析、文字信息所反映的词义分析以及缩略语句的歧义问题。
4 消除歧义问题的方法
4.1 处理歧义问题的策略
1)在对中文信息处理中的歧义问题的处理过程中,我们在研究过程中主要是两方面的工作内容,一方面就是对目前存在的歧义进行定义,另一方面就是对歧义进行类别区分。
2)在研究的过程中,会针对歧义出现的规则进行对消歧工作的开展。在2005年前对于歧义问题的分析处理中,着重以歧义出现的规则为主要的主导研究方式。后来这种方式慢慢被人们所摒弃,成为消歧工作的偏门手法[4]。
3)通过大家对消歧问题的不断研究,逐渐对消歧工作产生了新的工作方式,这种方式是基于规则的策略下有效的结合了统计的方式。通过二元数据的分析,对所使用的方法进行评估。随着大家对这种消歧方式的使用,越来越多的人开始认可统计策略带来的消歧工作的高效率。因此,统计方式逐渐成为了消歧手段中的主打方式。
4)随着知识被不断的积累,知识库的建立。以知识库作为信息技术处理基础的方式也被大家认可,并产生了一定的积极的作用。随着知识库的不断发展和完善。能够使研究者更好的结合统计策略和规则策略对消歧问题做出更好的处理。
人们不断地对歧义问题和消歧问题进行研究,相信会有更多的消歧方式出现,并加入到消歧方式之中对目前的消歧工作提供有效的补益。
4.2 处理歧义的方式方法
1)随着对歧义问题的研究逐步发展成熟,语料库的发展也逐渐的完善。因此,通过语料库对歧义问题进行评测已成为目前研究的主要趋势。
目前所要面对的问题就是,对于歧义的规则和知识库的信息内容需要有人进行不断地完善和筛选。同时,这个工作并不是短期内就可以结束的工作,它需要相关人员进行长期的工作。于是研究者想出了相对较为简单的方式,通过对语言进行收集并加工,将语言资源做成语料库,通过不断地实验对计算机进行训练,使计算机自发
您可能关注的文档
最近下载
- 质子治疗与护理.pptx
- 李清照《声声慢》完整教学课件.ppt VIP
- DL-T5210-2021电力建设施工质量验收及评价规程最新表格.docx
- 在线网课学习课堂《雷达原理》单元测试考核答案.docx VIP
- 《工程勘察设计收费标准》2002年修订本完整.pdf VIP
- 服装行业智能化产业生态构建策略研究:2025年现状与未来五到十年展望.docx
- SCIP准备和提交教程.pdf VIP
- 在线网课学习课堂《雷达原理与系统(中国人民解放军战略支援部队信息工程)》单元测试考核答案.docx VIP
- 城市轨道交通调度指挥:列车运行计划及列车运行图PPT教学课件.pptx
- 社会影响力投资手册.pdf
原创力文档


文档评论(0)