基于婚姻法的智能问答技术研究及发展趋势.docVIP

基于婚姻法的智能问答技术研究及发展趋势.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于婚姻法的智能问答技术研究及发展趋势 0 引 言 随着人工智能的飞速发展, 利用深度学习等技术进行专业领域的智能处理成为了一个研究热点, 国内外在问答系统方面已经有了很长时间的研究。Pythia[1]是基于本体理论的自动问答系统, 以领域知识库为主体, 准确率较高但同时人工成本也较高。TBSL 则是基于专家模板,同样存在人工成本高的问题,且过于丰富的候选项使得其性能下降。 台湾国防大学的 CQAS 则注重于实体间的关系, 以特征因子间的关系串列作为搜索依据。但这些系统大都缺乏深层次的语义理解和推理, 导致该类应用不能根据上下文的语义联系来理解特定含义和理解问题的逻辑[2], 同时也不能根据提问逻辑准确地答出相关条目和典型案例。在类似于法律咨询的复杂情况咨询领域, 并不能很好地满足用户需求。针对上述问题, 本方法首先咨询了专业的法律人士并获取了充分的婚姻法专业问答信息作为数据来源。使用引入了attention 机制的双向长短时神经记忆网络 (bi-direc-tionallongshortterm memorynetworks,BiLSTM) 模型进行在相似问题快速查询与答案生成。相较于传统知识问答系统,本方法提升了对问题的逻辑理解能力, 增加了回答的准确度,提升了返回典型案例的准确性。 1 婚姻法问答技术框架 本方法描述婚姻法问答应用技术, 旨在形成一套完整的婚姻法问答知识快速检索获取的技术方法论, 主要内容包括如下部分: 基于婚姻法的知识图谱构建技术、知识快速检索与智能问答技术。 首先,开展婚姻法知识收集和知识图谱构建技术, 通过收集和归纳婚姻法的专业知识、网络资源、图书文献完成知识的获取, 构建可拓展的典型问答集和知识图谱, 作为知识快速检索与智能问答的输入数据源[3]。然后, 开展知识快速获取研究, 采用典型问答集对于相似问题在答案筛选阶段进行相似度匹配,通过 TransR 对原始问题进行预处理,输入训练好的 BiLSTM 模型,基于对齐特性引入at-tention机制 以构建智能语言问答。 2 基于婚姻法的知识图谱构建框架 婚姻法知识图谱构建的总体方案如图2 所示, 总体方案的体系结构由概念构建、关联计算、关系抽取、集成验证4部分组成[4,5]。 首先,在概念构建这一阶段, 通过婚姻法内容和收集的相关案例,进行婚姻法概念的发现与提取, 建立领域术语集,这是知识图谱构建的基础。婚姻纠纷可分为同居纠纷、结婚纠纷以及离婚纠纷 (离婚纠纷本身又包括离婚纠纷、离婚后财产纠纷、子女抚养纠纷等一系列的矛盾纠纷),对不同领域语料进行单独分析, 再进行整合。该过程分为分词、实体抽取和概念发现。婚姻法实体抽取是在分词基础上根据法律内容和相关案例内容的统计特性和语言规则相结合的方式识别婚姻法相关实体边界并获取候选实体集,再利用邻接特征量来评价每一个候选实体的完整性, 从而得到语义实体集。婚姻法概念发现则是通过以新词的 构词知识为基础建立新词识别的常用构词库, 同时从婚姻法相关案例的特征出发建立特殊构词规则库, 并按照相应规则过滤并确定新词。 其次,关联计算的目的是发现婚姻法各概念之间的关系,这是知识图谱结构中关系发现的第一步, 是连接知识节点的开始。本文采用基于词性-连续词袋模型 POS-CBOW的词关联算法对已构建好的婚姻法语义语料进行深度学习。基于此语言模型, 完成对各种信息的语句修正和词性标注层等工作,再根据向量的余弦值和词性比较, 计算词之间的相似性[6]。 然后,关系抽取指的是进一步对关系内容进行挖掘, 比如关系的方向、大小等。上文中关联计算是发现概念之 间的显式关系, 而这一阶段发现概念之间的隐式关系。本文以海量婚姻法相关知识为数据基础, 以浅层语义模型为计算工具,得出具有层级关系的词集。其层级关系主要依 据以高维空间语言模型计算出的词向量。根据词向量的高 维空间分布,可以得出某一词向量的相近词集, 并根据空间距离对联想进行分级, 从而建立起与该词相关的语义实时扩展联想[7]。从效果上来看, 无监督的机器学习方法的效果不亚于人工标注的,并且连续词袋模型 POS-CBOW 还可以进行多层次的相似词发现。例如, 在此步中可以发现协议离婚 和 诉讼离婚 同由 离婚 指出, 表示皆为解除婚姻关系的方式。 总结来说就是在对婚姻法语料进行分类, 从数据库中搜索挖掘出其中实体, 规定各实体之间的关系类别, 通过交叉信息熵计算每个实体的关联关系, 从而建立整体的实体关系展示图谱, 为之后婚姻法知识快速检索和智能问答做好基础工作。 3 多维婚姻法场景下的知识快速检索和智能问答研究 基于婚姻法问答集的知识快速检索可以满足已有问题的检索,

文档评论(0)

潇湘画里 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档