面向问答系统的实体识别与分类研究-计算机应用技术专业论文.docxVIP

面向问答系统的实体识别与分类研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
沈阳航空:1:业学院硕十!学位论文摘要 沈阳航空:1:业学院硕十!学位论文 摘要 问答系统是信息检索的高级形式,也是该领域的研究重点和热点。它是综合的技术 处理系统,其设计与开发需要分词、词法分析、检索、实体识别、答案抽取等几个方面 的技术支撑。其中,实体的识别与标注是问答系统的关键技术之一,直接关系到问句类 型的判定和答案的抽取。问答系统中问句类型的判定与实体的识别紧密相关。根据具体 的需要,问题的类型有不同的分法,一般情况下,事实类型问题总是涉及人、时间、地 点、数量等项,而对于某一种类型还可以分为不同的层次,如地点下可以细分为国家、 省、市、山、河、湖泊等。本文面向问答系统,针对其涉及实体的层次性和多类性,研 究实体识别与分类方法,主要工作为: 1.通过对通用领域问答系统的问题分类和实体分类体系的研究,本文在此基础上提 出一种基于规则和统计的实体识别与分类方法,主要结合了实体分类词典和条件随机场 算法。 2.本文进行了基于实体分类词典的己登录词识别研究,通过中文Wiki百科开放数据 库等途径得到包含近三十万词条的面向QA的实体分类词典,词典在内存中采用索引树 的形式存放,并利用该词典进行已登录词的识别和分类,提高了实体识别与分类的效果。 3.本文提出一种基于条件随机场的两阶段命名实体识别方法,在封闭测试中,两阶 段F.值为86.30%,与一阶段的F.值88.01%相比,在结果上相差1.5个百分点,但在时 间复杂度上可以降低80%左右。 4.本文对基于条件随机场的中文组织机构名识别的进行了进一步的研究,在特征选 取方面,将语言学特征与词语概念特征进行了有效的融合,同时,对字模型和词模型在 选取不同特征情况下分别进行比较实验,对各方法的结果分析表明,结果之问存在互补 差异性,融合模型将取得比单一模型更好的结果。 本文的方法为多类性和层次性实体的识别做了初步的尝试,取得了一定的结果。相 信随着中文命名实体识别技术的不断发展,实体识别的分类效果将会获得更大的提高。 关键词:问答系统:实体识别与分类;分类词典;条件随机场;机构名识别;字模型 沈Ij¨航空丁业学院硕十!学位论文 沈Ij¨航空丁业学院硕十!学位论文 Abstract Question Answering System(QAS)is both high—level form of information retrieval and research emphasis and hotspot in this field.It is an integrated technical processing system which is supported by the technique of word segment,lexical analysis,retrieval,entity recognition and answer extraction.One of the key technique of QAS is entity recognition and tagging which directly decide the judgement of question type and the extraction of answers. The judgement of question type is very related to entity recognition in QAS.According to the detail demands,question type has different classifications.In general,the factoid questions are always related to the person,time,place,quantity and etc.But for some type there are different levels,for example a place can be subdivided into country,province,city,mountain, river,lake and SO on.The paper emphasizes entity recognition and classification method by the levels and diversity of the entity.Main work is 1.This thesis proposes a method for entity recognition and classification based on rules and statistic,which is mainl

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档