关于文本挖掘技术的金融预测方法研究.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
国内图书分类号:TP309.2 学校代码:10213 国际图书分类号:681.37 密级:公开 工工工学学学博博博士士士学学学位位位论论论文文文 基于文本挖掘技术的金融预测方法研究 博士研究生:王 保华 导 师:王 晓龙 教授 申 请 学 位:工学博士 学 科:计算机应用技术 所 在 单 位:深圳研究生院 答 辩 日 期:2012 年04 月 授予学位单位:哈尔滨工业大学 Classified Index: TP309.2 U.D.C: 681.37 Dissertation for the Doctoral Degree in Engineering FINANCIAL FORECASTING METHOD BASED ON TEXT MINING TECHNOLOGIES Candidate: Wang Baohua Supervisor: Prof. Wang Xiaolong Academic Degree Applied for: Doctor of Engineering Specialty: Computer Application Affiliation: Shenzhen Graduate School Date of Defence: April, 2012 Degree-Conferring-Institution: Harbin Institute of Technology 摘 要 摘 要 随着世界经济全球化及世界金融业的不断发展,金融活动中的不确定性 增加,金融预测日益受到学术界及金融业界的高度重视。人们希望通过对金 融经营管理活动中难以确定的未来发展趋势和规律进行研究,做出预见性的 判断与推测,使金融活动中的不确定性最小化,为制定金融计划和金融决策 提供依据。近年来由于海量金融信息的出现,数据挖掘技术在金融预测领域 开始得到广泛研究与应用,但大多数的研究只局限于数值信息。海量金融信 息中有大量的数据是以文本的形式存在,如何从这些文本信息中挖掘出有价 值的信息变得异常重要。 为了提高金融预测的准确度,本文主要研究将文本挖掘相关技术引入 到金融预测领域。在金融文本预处理方面,对金融报告的语义标注进行了研 究,在标注的金融文本基础上,对金融报告的可信度进行了分析。进而基于 文本挖掘相关技术,对金融预测的两个重要问题:金融时间序列及金融短期 波动率进行了预测研究。研究内容主要包括: 第一,面向金融预测的年报语义标注方法研究。年度报告已经成为投资 者进行金融预测时重要的信息来源。为了使投资者更方便和更准确检索到所 需信息进行预测,针对中文与英文年报,本文分别提出了基于领域本体和自 然语言处理技术的语义标注方法与基于正则表达式的半自动语义标注方法。 对中文年报的公司基本信息及英文年报的管理层讨论与分析部分所进行的语 义标注实验表明,所提出方法是有效的。 第二,基于文本挖掘技术的年报可信度研究。上市公司的年报是投资者 进行金融预测的重要信息来源,当上市公司的报告造假时,所做的预测将无 效并将给市场参与者带来巨大损失。已有的研究表明基于语言特征的识别方 法在造假识别方面是一种有效的方式。本文在年报可信度分析领域引入了无 监督机器学习方法,基于已标注的年报管理层讨

文档评论(0)

zz921 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档