- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
:吾对晤系统的语言分析
:吾对晤系统的语言分析 摘要
限定领域汉语口语人机对话系统的语言分析 摘要
自然语言处理己历时几十年了,热潮莫过于机器翻译。机器翻译的热潮过去后 自然语言处理逐渐进入平静、现实的务实阶段。近期人们将目标定在文本的自动分 类和摘要、信息的自动检索和过滤以及限定领域的人机对话系统等方面。本文介绍 汉语口语人机对话系统语言分析的研究。
语言处理中,实用性很强、高效的是统计方法。但基于规则的方法可以细致刻 划语言内在结构的各个方面,如果能综合运用情景、上下文和常识获取语义特征 在限定领域的情况下,分析的准确率将会显著提高。
本文根据汉语口语缺省多、插入语多、短旬多和语序灵活等语言特点,设计了 种以规则为主、结合概率信息的语言综合分析方法。在汉语分词和词性标注的基 础上,基于合一文法利用图算法进行部分句法分析,最后结合上下文、情景、常识 和概率信息获取语义特征。该方法有效提高了汉语口语对话系统语言分析的准确 性,同时考虑了效率和领域切换等实用方面的问题。并实现了上海市交通信息查询 系统一--SHJTQ,同时完成了相关的测试评价工作,从而确保了系统的正确性、有
效性。
词切分和词性标注方面,本文通过建立索引和采用合适的Hash算法,改进了词 表的组织形式,极大提高了分词和词性标注的效率。从而减少系统实时响应时间。 句法分析方面,本文根据汉语El语特点进行了如下改进和尝试:(1)、采用部分 句法分析而不是常规的完全句法分析,从而有效分析含有插入语、缺省、语序变化、
汉语口语对话系统的语言分析
汉语口语对话系统的语言分析 摘要
多个短句等不规正语句;(2)、采用基于合一文法的语法体系,通过特征校验限制句 法规则归约,减少句法分析的歧义;通过特征传递获取短语的语义语法信息,以便 进一步获取整句的语义特征; (3)、实现了特征和句法规则的预编译,使得句法知 识库具有良好的开放性,减少了领域切换时所需工作量。
语义分析的难点在于如何处理缺省、指代、否定等复杂语言现象。本文从所限 定的领域特点出发,尝试给出一些实用的处理方法:(1)、采用合一算法根据上下文、 情景求解缺省;(2)、采用史列表方法结合语法语义限制规则求解指代;(3)、将否 定分为句问否定和句中否定,根据“否定候选集一对比删除”流程确定否定词的具 体辖域。这些方法充分利用了上下文、情景和常识,在本系统中处理正确率达到了 80%以上。
最后对本文所提出的语言分析方法进行了测试。测试结果表明该方法不但可以 有效处理规正的查询语句,而且可以处理含有插入语、多个短句等非规正语句;处 理效率基本实用。在此基础上,提出了进一步的工作方向。
上述方法及系统已被采纳于上海市科委重点项目中。
关键字: 自然语言处理,人机对话,部分句法分析,语义分析,合一算法
Ⅱ
LANGUAGE
LANGUAGE ANALYSIS IN A DOMAIN—SPECIFlC CHlNESE SPOKEN
D l ALOGUE SYSTEM
ABSTRACT
Natural language processing has been developed for decades.Its climax is machine translation.After that its research becomes more realistic.Current researches foCUS on automatic abstracting,information retrieval and dommn—specific dialogue syNem etc.
This paper presents a language analysis method for a dommn—specific Chinese spoken
dialogue system.
There are two kinds of language analysis methods.One is statistic·based method,
and the other iS mle-based method.The statistic-based method iS more effective,but rule—based method Can describe the inner structures of language in more detail.If
您可能关注的文档
- 关于乌海六中绩效工资改革方案中“学生成绩”一项考核的实效性研究-现代教育技术专业论文.docx
- 海林市水资源优化配置研究-农业水土工程专业论文.docx
- 关联理论对英文广告及广告翻译的解读-外国语言学与应用语言学专业论文.docx
- 含传输线网络的优化设计-电工理论与新技术专业论文.docx
- 含偶氮苯基团功能高分子的制备及其光致取向性能的研究-材料学专业论文.docx
- 广西岩溶区生态恢复模式与可持续经营-生态学专业论文.docx
- 国际贸易电子邮件的语料分析-外国语言学及应用语言学专业论文.docx
- 广东电网分区供电运行方式研究-电气工程专业论文.docx
- 广西瘿螨分类研究-农业昆虫与害虫防治专业论文.docx
- 含缺陷工程材料的剩余强度分析-固体力学专业论文.docx
- 主题课程整理大班上.doc
- 2026人教版小学语文三年级上册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学语文四年级下册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学二年级上册数学期末综合试卷精选3套(含答案解析).docx
- 2026人教版小学语文四年级上册期末综合试卷3套(含答案解析).docx
- 2026人教版小学二年级下册数学期末综合试卷3套(打印版含答案解析).docx
- 2026年地理信息行业年终总结汇报PPT.pptx
- 板块四第二十一单元封建时代的欧洲和亚洲 中考历史一轮复习.pptx
- 中考历史一轮复习:板块四第二十单元古代亚、非、欧文明+课件.pptx
- 第二次工业革命和近代科学文化中考历史一轮复习.pptx
原创力文档


文档评论(0)