基于知识图谱的金融问答系统的研究与实现.pdf

基于知识图谱的金融问答系统的研究与实现.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

随着人均GDP越来越高,大量的人投身于金融市场,但快速精确的获取所需信息

却是一个难题。因为对传统搜索引擎而言,用户输入问题后,通过浅层语义匹配,返

回的各种网页,不仅不能明白提问者的真正想法,还需要用户自己花费时间提炼答案。

而问答系统在用户提问后,会定位用户的真实想法,返回直观精炼的答案,从而提高

用户体验感。本文将金融信息与自然语言处理技术结合,设计了一种基于知识图谱的

金融问答算法,并完成了一个基于知识图谱的金融问答系统,主要开展的工作如下:

(1)采用自底向上的方式构建金融知识图谱。首先要获取数据,通过接口调用和

设计爬虫程序获得数据,并将数据进行清洗。之后依照一些规则对得到的数据进行实

体,属性和关系的提取,转化为三元组。最后通过neo4j图数据库将获得的三元组信息

进行存储,实现可视化查询。

(2)基于知识图谱的金融问答算法设计。算法的核心是将用户所提问题中的关键

字链接到知识图谱中,返回直观简洁的答案。这一过程主要包括三个任务,金融问句

的实体识别、分类和答案查询。使用BiLSTM-CRF命名实体识别模型识别问句的实体

和属性,用朴素贝叶斯分类器进行问句分类后得到一个查询模板,实体属性与查询模

板结合构成Cypher查询语句,然后在构建的知识图谱中进行查询,返回答案。同时设

置了命名实体识别实验和问题分类实验,在构建的数据集上,BiLSTM-CRF取得了0.9

的F1值,朴素贝叶斯分类器取得了0.95的F1值。

(3)金融问答系统搭建。使用Flask框架搭建基于Web端的金融问答系统,整个

系统分为三个模块,数据模块、问答模块、前端展示模块。

综上所述,本文成功搭建了基于知识图谱的金融问答系统,并对系统的功能和性

能进行了测试,问答的准确率为82.5%,测试结果表明本文所设计的金融问答系统可以

帮助用户快速获取金融产品的相关信息。

关键词:问答系统;知识图谱;命名实体识别;朴素贝叶斯分类器

I

ABSTRACT

WiththeincreasingpercapitaGDP,alargenumberofpeopleareinvolvedinthe

financialmarket,butgetingtheneededinformationfastandaccuratelyisadifficultthing.

Becausefortraditionalsearchengines,aftertheuserentersaquestion,throughshallow

semanticmatching,thevariouswebpagesreturnednotonlycannotunderstandtheuser'strue

intention,butalsorequirestheusertospendtimerefiningtheanswer.Aftertheuserasksa

question,thequestionansweringsystemwilllocatetheuser'srealthoughtsandreturn

intuitiveandrefinedanswers,therebyimprovingtheuserexperience.Thispapercombines

financialinformationwithnaturallanguageprocessingtechnology,designsafinancial

questionansweringalgorithmbasedonknowledgegraph,andcompletesafinancialquestion

answeringsystembasedonknowledgegraph.The

您可能关注的文档

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档