结合文本倾向性分析的股评可信度计算研究-计算机科学与技术专业论文.docxVIP

结合文本倾向性分析的股评可信度计算研究-计算机科学与技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Classified Index: TP391.4 U.D.C: 621.3 Dissertation for the Master Degree in Engineering RESEACH ON CREDIBILITY ESTIMATION OF STOCK COMMENTS WITH SENTIMENT ANALYSIS Candidate: Qiaoyun Qiu Supervisor: Associate Prof. Ruifeng Xu Academic Degree Applied for: Master Degree in Engineering Speciality: Computer Science and Technology Affiliation: Shenzhen Graduate School Date of Defence: December,2014 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学工学硕士学位论文 哈尔滨工业大学工学硕士学位论文 -I- -I- 摘要 随着互联网和金融服务行业的联系日益密切,人们对于快速、准确获取金融信 息的需求越来越迫切。但大量不可信信息的存在给投资决策带来了巨大的挑战。如 何在庞大的数据中找到可信的信息成为了金融信息服务领域的关键性问题。针对 股票投资这个特定领域的金融信息服务需求,本文研究结合文本倾向性分析的股 评文本可信度计算方法。 本文的主要工作包括:第一、在对股评文本和股票领域文本特点进行分析的基 础上,研究面向股评文本的倾向性分析方法。着重研究三种特征选择方法,包括: 基于 Uni-Gram/Bi-gram 过滤的特征选择方法、基于自动发现领域词典的特征选择 方法以及基于文章结构的特征选择方法,实验显示当三种特征同时使用时,系统的 性能最优。第二、由于中国股市没有做空机制,导致股评文本中正面股评的数量远 远大于负面股评。股评类别分布的不平衡明显影响了基于有监督学习的分类器性 能。为此,研究了面向不平衡股评数据的倾向性分析。这里分别研究了基于过采样 和基于集成学习的不平衡分类处理方法。实验结果显示基于过采样的方法对系统 性能的提升有限,而基于集成学习的方法明显提高了少类样本分类性能。第三、利 用带有分类标注的股评和股评发布后实际股价变化的一致性分别评估发布者的历 史可信度和行业可信度。第四、结合股评文本倾向性分析和信息发布者的可信度评 估实现了股评可信度计算和股价预测系统。实验显示本文实现系统的预测性能优 于主流股评机构。 本文的主要贡献在于:第一、基于短股评文本建立了股评相关的领域词典。在 对股评文本的特点深入观察分析的基础上,提出了多种有效特征用于股评倾向性 分析。第二、对股评数据的特点进行了深入分析,并设计实现了两种面向不平衡训 练数据的倾向性分类方法。实验结果显示,基于集成学习的方法有效提高了少类样 本的分类性能。第三、设计实现了结合股评文本倾向性分析、股评发布者历史可信 度和行业可信度的股评可信度计算方法。 关键词:倾向性分析;股评;可信度计算;不平衡分类;集成学习 -II- -II- Abstract As the relation between the Internet and financial services grows, the requirement of getting financial information quickly and precisely becomes more and more urgent. But the incredible information has make great challenge to the investment decisions. How to find out credible information from large scale of data turns to be a key issue. There has already been lots of researchers engaged to identify credible information, while it is short in relative work and great developments in stock comments. Therefore this paper has analyzed the stock comment in financial information service, and come up with the method of calculating the

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档