大数据时代金融专业数学的发展趋势.docVIP

大数据时代金融专业数学的发展趋势.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档(可编辑) 值得下载 大数据时代金融专业数学的发展趋势 [摘 要]随着科学技术的飞速发展和人们获取数据的多样化,人类拥有的数据急剧增加。在大数据时代,数据已成为新型战略资源,是驱动创新的重要因素。如何获取隐藏在数据背后的潜在的规律备受研究人员关注。数据挖掘是一门边缘应用学科,它的蓬勃发展是由于它在各个领域的广泛应用。结合金融数据的特点以及目前数据挖掘、机器学习存在的问题,研究未来金融专业数学的发展方向和动态趋势,对于大数据时代下培养金融专业学生具有十分重要的意义。 [关键词]数据挖掘 机器学习 支持向量机 金融数据 [中图分类号] F83 [文献标识码] A [文章编号] 2095-3437(2014)14-0029-02 一、背景 数据是与自然资源、人力资源一样重要的战略资源,其背后隐含着巨大的经济价值。近年来,“大数据”研究已经备受关注。[1]例如,2012年,美国政府在国内发布了“大数据”研究和《发展倡议》,投资约两亿美元发展大数据研究,用以强化国土安全、转变教育学习模式和进一步加速科学和工程领域的创新速度和水平。继1993年美国宣布“信息高速公路”计划后,这项决定标志着美国的又一次重大科技发展部署。美国政府认为“大数据”研究势必对未来的科技、经济等各领域的发展带来深远影响。在大数据应用的技术需求牵引下,数据科学研究和人才培养引起了各国的重视。美国哥伦比亚大学和纽约大学、澳大利亚悉尼科技大学、日本名古屋大学、韩国釜山国立大学等纷纷成立数据科学研究机构;美国加州大学伯克利分校和伊利诺伊大学香槟分校、英国邓迪大学等一大批高校开设了数据科学课程。 二、机器学习理论 机器学习(machine learning)是继专家系统之后人工智能应用的又一重要研究内容,在某种意义上,机器学习或将认为是数据挖掘的同义词。数据挖掘是指有组织、有目的地收集数据、分析数据,从海量数据中寻找潜在规律,并使之为决策规划提供有价值信息的技术。机器学习是人工智能的核心部分,在金融、工业、商业、互联网以及航天等各个领域均发挥着重要的作用。对机器学习研究的进展,必将对人工智能、数据挖掘领域的发展具有深远影响。 机器学习方法主要包括:Exper System(专家系统)、K-Nearest Neighbor(K近邻算法)、Decision Tree(决策树)、Neural Net(神经网络)、Support Vector Machine(支持向量机)、Cluster Analysis(聚类分析)等。近几年,研究人员将遗传算法、神经网络、系统理论以及当代数学研究的最新进展,应用于金融领域。这使得金融领域数据挖掘在金融管理中备受青睐。例如,产品定价、金融风险管理、投资决策甚至金融监管都越来越重视金融数据挖掘,通过数据挖掘发现金融市场发展的潜在规律与发展动态。机器学习理论及其在金融领域的应用成为了一个比较热的研究领域。[2] [3] 三、金融数据的特点 在众多机器学习方法中,基于Logistic回归、判别分析等传统的统计方法,对金融模型假定条件非常严格,在实际应用中很难达到理想效果。其原因在于对金融数据的非线性和非平稳性的操作具有片面局限性,在实际处理金融数据时,既定假设与金融市场发展实际并不完全一致,这样可能会影响模型的推广能力和泛化能力。 基于分类树方法、K-近邻判别分析、遗传算法等传统的非参数统计方法,其预测能力较好,但不能量化解释指标的程度。例如,K-近邻判别分析是一种非参数距离学习方法,通常按照数据样本之间的距离或相关系数进行度量,这样会受到少数异常数据点的影响。但是,在相同样本容量下,如果对于具体问题确实存在特定参数模型可以应用时,非参数方法效率相对较低。以神经网络、支持向量机等为典型的机器学习方法,优点在于可以有效处理金融数据的非线性特性,并且不需要事先严格的统计假设,这样会表现出较强的适应效果,充分体现人工智能、机器学习等方法的魅力。神经网络预测精度是各种机器学习方法中相对较好的,因为在一定程度上,神经网络可以按照任意精度近似非线性函数,为高度非线性问题的建模和算法提供相应支持。尽管神经网络技术进步有目共睹,但仍然存在一些难题。例如,通常难以确定隐层节点数,并会存在“过学习”现象和局部极小值等问题。 四、支持向量机 传统的统计模式识别方法是在样本数目足够多的情况下进行的,但是样本数目足够多在实际问题里面往往难以保证。1968年Vapnik等人首次提出了统计学习理论,专门从事有限样本情况下机器学习规律的研究。在此基础上,1995年Vapnik等人首先提出支持向量机(Support Vector Machine,简称SVM)的学习方法,它是数据挖掘中的一项新的技术。SVM是

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档