- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Classified Index: TP391.4 U.D.C: 621.3
Dissertation for the Master Degree in Engineering
RESEACH ON CREDIBILITY ESTIMATION OF STOCK COMMENTS WITH
SENTIMENT ANALYSIS
Candidate: Qiaoyun Qiu
Supervisor: Associate Prof. Ruifeng Xu
Academic Degree Applied for: Master Degree in Engineering
Speciality: Computer Science and Technology
Affiliation: Shenzhen Graduate School
Date of Defence: December,2014
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
哈尔滨工业大学工学硕士学位论文
-I-
-I-
摘要
随着互联网和金融服务行业的联系日益密切,人们对于快速、准确获取金融信 息的需求越来越迫切。但大量不可信信息的存在给投资决策带来了巨大的挑战。如 何在庞大的数据中找到可信的信息成为了金融信息服务领域的关键性问题。针对 股票投资这个特定领域的金融信息服务需求,本文研究结合文本倾向性分析的股 评文本可信度计算方法。
本文的主要工作包括:第一、在对股评文本和股票领域文本特点进行分析的基 础上,研究面向股评文本的倾向性分析方法。着重研究三种特征选择方法,包括: 基于 Uni-Gram/Bi-gram 过滤的特征选择方法、基于自动发现领域词典的特征选择 方法以及基于文章结构的特征选择方法,实验显示当三种特征同时使用时,系统的 性能最优。第二、由于中国股市没有做空机制,导致股评文本中正面股评的数量远 远大于负面股评。股评类别分布的不平衡明显影响了基于有监督学习的分类器性 能。为此,研究了面向不平衡股评数据的倾向性分析。这里分别研究了基于过采样 和基于集成学习的不平衡分类处理方法。实验结果显示基于过采样的方法对系统 性能的提升有限,而基于集成学习的方法明显提高了少类样本分类性能。第三、利 用带有分类标注的股评和股评发布后实际股价变化的一致性分别评估发布者的历 史可信度和行业可信度。第四、结合股评文本倾向性分析和信息发布者的可信度评 估实现了股评可信度计算和股价预测系统。实验显示本文实现系统的预测性能优 于主流股评机构。
本文的主要贡献在于:第一、基于短股评文本建立了股评相关的领域词典。在 对股评文本的特点深入观察分析的基础上,提出了多种有效特征用于股评倾向性 分析。第二、对股评数据的特点进行了深入分析,并设计实现了两种面向不平衡训
练数据的倾向性分类方法。实验结果显示,基于集成学习的方法有效提高了少类样
本的分类性能。第三、设计实现了结合股评文本倾向性分析、股评发布者历史可信 度和行业可信度的股评可信度计算方法。
关键词:倾向性分析;股评;可信度计算;不平衡分类;集成学习
-II-
-II-
Abstract
As the relation between the Internet and financial services grows, the requirement of getting financial information quickly and precisely becomes more and more urgent. But the incredible information has make great challenge to the investment decisions. How to find out credible information from large scale of data turns to be a key issue. There has already been lots of researchers engaged to identify credible information, while it is short in relative work and great developments in stock comments. Therefore this paper has analyzed the stock comment in financial information service, and come up with the method of calculating the
您可能关注的文档
- 结合权重因子与特征向量的文本聚类研究与应用-计算机技术专业论文.docx
- 结合全局和局部特征的人体行为识别技术研究-模式识别与智能系统专业论文.docx
- 结合全局与局部信息的活动轮廓模型研究-应用数学专业论文.docx
- 结合认知记忆策略的对外形似字教学设计-汉语国际教育专业论文.docx
- 结合乳腺肿瘤患者血浆游离DNA和无创产前检测结果的模拟研究-外科学专业论文.docx
- 结合入侵检测的安全网管系统研究与实现-计算机应用技术专业论文.docx
- 结合社会化网络的文献计量及应用框架研究-计算机软件与理论专业论文.docx
- 结合社区结构的博客检索系统设计与实现-计算机科学与技术专业论文.docx
- 结合使用挖掘和内容挖掘的Web推荐服务研究-计算机软件与理论专业论文.docx
- 结合市场定位分析研究高层住宅套型设计-建筑设计与理论专业论文.docx
- 结合我的创作雨中景观浅谈油画中的构思-美术专业论文.docx
- 结合先验形状信息和序贯学习的心血管内超声外弹力膜检测-生物医学工程专业论文.docx
- 结合显式与隐式算法的PZT型智能钢筋损伤监测的三维数值模拟-土木工程专业论文.docx
- 结合显著性目标检测与图像分割的服饰提取算法研究及实现-计算机应用技术专业论文.docx
- 结合相干斑抑制和区域生长的SAR海冰图像MRF分割方法研究-电子与通信工程专业论文.docx
- 结合消费偏好动态演变机制的个性化商品推荐方法研究-管理科学与工程专业论文.docx
- 结合小波变换和独立分量分析的肌电信号处理新方法-检测技术与自动化装置专业论文.docx
- 结合小波域去噪和运动估计的监控场景分析研究-通信与信息系统专业论文.docx
- 结合信任模型的协同过滤推荐系统研究与实现-计算机技术专业论文.docx
- 结合型含磷脂加脂剂的制备应用研究及MST在含磷脂废水中的应用-化学工程专业论文.docx
原创力文档


文档评论(0)