基于深度学习的领域情感词典自动构建.PDF

基于深度学习的领域情感词典自动构建.PDF

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
总第22 期 2018 年 第10 期 基于深度学习的领域情感词典自动构建* ——以金融领域为例 胡家珩 1 岑咏华 1 吴承尧 2 1(南京理工大学经济管理学院 南京 210094) 2(南京农业大学金融学院 南京 210095) 摘要: 【目的 】为特定领域情感分析任务构建一个适用的情感词典。【方法 】以金融领域为例, 结合语料库和知 识库的特点, 提出一种全新的构建情感词典的方法: 利用词向量方法将文本信息映射到向量空间, 借助已有的 通用情感词典, 自动标引训练语料, 按照9:1 的比例构建训练集和预测集。使用Python 构建深度神经网络分类器, 判断特定领域候选情感词的情感极性, 构成情感词典。【结果 】本文构建的神经网络分类器的训练集准确度为 95.02%, 预测集准确度为 95.00%, 同时证明了利用本文方法所构建的情感词典在金融领域中的表现优于其他已 有方法。【局限 】抽取种子词的方法需要进一步优化。【结论 】本文方法解决了训练神经网络分类器中训练语料 不足的问题, 同时解决了词向量的语义相关性无法区分情感信息的问题。在构建面向特定领域情感词典上具有 较好的表现, 为该领域其他研究提供参考依据。 关键词: 情感词典 深度学习 金融领域 词向量 神经网络 分类号: G202 F832.5 DOI : 10.11925/infotech.2096-3467.2018.0169 知网 HowNet 情感词典等都是通用的情感词典, 在金 1 引 言 融领域情感分析任务中无法准确判断某些金融领域特 Web2.0 时代, 各行各业皆借助互联网快速发展, 有词汇的情感极性, 从而影响情感分析的准确度。因 如金融行业由原本单一的线下交易逐渐发展成为线上 此, 构建一个面向金融领域的情感词典以提高情感分 线下同步交易的局面。同时, 大量的财经媒介信息借 析的性能极为重要。同时, 随着深度学习的快速发展, 助互联网在投资者之间相互传播。对媒介信息的情感 词向量模型等的提出恰好为相关研究提供了契机。 分析研究不但能够更好地了解金融市场走势, 而且能 够为投资者制定良好的投资决策提供参考依据。对金 2 文献综述 融文本的情感分析方法主要有基于机器学习的方法和 基于情感词典的方法, 二者都需要一个合适的情感词 目前, 大量研究者试图对金融文本进行情感分析, 典。基于机器学习的方法需要情感词典对训练语料进 并借此分析投资者决策, 从而预测股票市场波动。 行特征标注, 从而提高分类器的性能; 基于情感词典 Smailović等[1]提出金融文本中的积极情感概率的变化 的方法主要依据情感词典对文本直接进行情感分析。 可以作为股票收盘价格的指示器, 通过对Twitter 的金 但是, 已有的情感词典, 如中国台湾大学情感词典, 融文本进行情感分析, 借助格兰杰因果分析验证假设, 通讯作者: 岑咏华, ORCID: 0000-0003-4321-8889, E-mail: cen@。 *本文系国家自然科学基金项目“投资者有限关注与证券市场监管: 基于大数据和计算实验的方法”(项目编号:、国家自 然科学基金项目“社会化影响下个体信息认知处理中的扭曲与偏见机制研究”(项目编号: 和国家社会科学基金重大项目“面 向知识创新服务的数据科学理论与方法研究”(项目编号: 16ZDA224)的研究成果之一。 Data Analysis and Knowledge Discovery 95 研究论文 进一步说明以金融文本情感分析预测股

您可能关注的文档

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档