面向股市预测的开放域事件抽取关键技术研究.docVIP

下载本文档

14
0
约3.28万字
约 34页
2022-05-20 发布于浙江
举报
版权申诉

面向股市预测的开放域事件抽取关键技术研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE 1 - 面向股市预测的开放域事件抽取关键技术研究摘要随着信息技术的不断革新与进步，网络上的各种数据每天都呈指数级增长，其中包含的各类文本数据更是海量，而如何对如此大规模的非结构化数据进行处理，从中高效的获取有价值的、用户感兴趣的信息资源成为了函待解决的重要问题。开放域事件抽取这一研究方向正是在这个背景下兴起的。本文的提出主要是基于利用新闻事件进行股市预测这一极具价值和应用前景的课题的需要，所以本文中的开放域事件抽取任务与传统事件抽取任务有一定区别。主要表现在通常的开放域事件抽取往往要抽取时间、地点、人物、数量等等很多个事件因素组成结构化的结果。然而对于股市预测，我们关注的只是施事者、事件动作和受事者这样的事件三元组。针对这种需求，本文将整个事件抽取过程分为了三个阶段：首先基于人工构建的句法规则进行无监督的事件抽取。然后对第一步抽取得到的事件关系，利用双向传播算法以及语义词典进行语义模式的泛化，并对泛化得到的语义模式进行聚类。最后利用句法方面的特征以及语义模式的一系列特征，利用一个逻辑斯谛回归分类器计算第一步抽取所得事件的置信度，对抽取结果进行筛选和优化。本文所使用的方法相当于使用语义模式信息对传统基于规则和句法特征的事件抽取进行了进一步优化，在两个新闻数据集上的实验表明这种优化算法在开放域事件抽取任务中能够取得较好的效果。本文对开放域事件抽取的研究不单可以作为基于新闻事件的股市预测系统的基石，同时也将对自动文摘、事理图谱的构建乃至文本推理任务有一定的帮助，因此本文有着重要的应用价值和研究意义。关键词：开放域；事件抽取；双向传播；LR模型 Abstract With the development and innovation of information technology,varies of data are growing Exponentially every day.It includes a mass of textual data as well.Then how can we process such huge amount of unstructured data and get valuable information resources that users are interested in become a important issue need to be solved.The research of open domain events extraction is risen in this background. The raise of this paper is mainly based on the need of a very valuable and applicational task that using the news events to predict the stock market.So there will be a little difference between the open domain events extraction task and traditional events extraction task.It’s basically behaved in that ordinary open domain events extraction tasks usually need to extract many event elements such as time,place,people and amount etc.However,for the task of stock prediction, we only focus on the triples contains actor,action and recipient. Due to this kind of need, the whole event extraction process is divided into three stages in this paper.First, unsupervised event extraction is performed based on the syntactic rules constructed by human.And then using a double propagation algorithm and a semantic lexicon to tag and generalize semantic patterns from the result of the first ste