- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 机器学习与金融计量 学习目标了解机器学习的基本概念、建模流程和应用范畴;熟悉几类经典的机器学习算法原理,并能利用Python进行实践;掌握神经网络模型搭建原理并能将其运用于金融市场分析之中。了解网络舆情与金融市场的关联性,及对金融风险的加速器作用,认识中国政府在金融风险监管中加强正确的舆论导向的重要性。本章导读机器学习(Machine Learning,ML),是基于有限样本训练模型,学习样本数据中的一般性规律,并利用这些规律进行预测的方法。机器学习在各个领域应用非常广泛,与模式识别、统计学习、数据挖掘、计算机视觉、语音识别以及自然语言处理等领域有着非常深的联系。在金融领域,机器学习发挥了重要作用,为欺诈检测、股票市场预测、个人征信评分、券商智能投顾、手机银行APP人脸识别等提供了有力的技术支撑。通过本章学习,学生应了解机器学习的概念、掌握常用机器学习算法原理,重现本章案例,提高使用机器学习对金融数据进行建模的能力。9.1 机器学习概述 9.2 机器学习经典算法9.3 人工神经网络9.4 模型评估选择9.5 专题9 纳入网络舆情的上证综指走势预测研究目录CONTENTS9.1机器学习概述 9.1 机器学习概述 机器学习一般可分为四种类型,即监督学习、无监督学习、强化学习和深度学习。监督学习(Supervised Learning) 从标签化训练数据集中推断出函数的机器学习任务。监督学习中通常将数据分为训练集和测试集,从训练数据集合中训练模型,再对测试数据进行预测。训练数据由输入和输出对组成,测试数据也由相应的输入输出对组成。根据标签类型不同,可将监督学习分为回归问题和分类问题,回归问题中标签是连续值,分类问题中标签是离散的类别。常见的监督学习算法有神经网络算法、支持向量机、决策树、随机森林等。 9.1 机器学习概述无监督学习(Unsupervised Learning) 即数据没有标签,其本质就是找到特征和标签间的关系。当有特征而无标签的未知数据输入时,即在缺乏先验知识的情况下,通过已有的关系得到未知数据标签。典型的无监督学习问题有聚类、降维、特征学习等,常见的主成分分析方法就是一种无监督学习算法。 9.1 机器学习概述强化学习(Reinforcement Learning) 用于描述和解决智能体(Agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。例如在围棋游戏中,玩家的每一步移动都会影响对手的反应和下一步棋的位置,从而影响输赢概率。因此,可以通过计算每个棋面的输赢概率,选择赢棋概率最大的下一步的位置走子。 9.1 机器学习概述深度学习(Deep Learning) 深度学习是近年来发展十分迅速的研究领域,并且在人工智能的很多子领域都取得了巨大的成功。深度学习问题本质上是一个机器学习问题,起源于人工神经网络的研究,但也可以采用其他模型(比如深度信念网络是一种概率图模型)。它的“深度”主要体现在两个方面:(1)强调模型结构的深度,神经网络模型中至少有3层以上的隐层节点;(2)强调特征学习,通过逐层特征变换,将低层特征形成更加抽象的高层属性类别或特征,以发现数据的分布式特征表示,从而使分类或预测更加容易。深度学习的代表性算法有卷积神经网络、循环神经网络、长短期记忆网络等。9.2 机器学习经典算法9.2.1 支持向量机 支持向量机的基本思想是构造一个最优分离超平面,将给定的两类样本分开,最优的分离超平面将使得两类样本对超平面的最小距离最大化。9.2.1 支持向量机 9.2.1 支持向量机 对于非线性可分的情况,可通过核函数将原数据映射到更高维的空间。此时使用超平面作为决策边界会带来分类损失,此时使用超平面作为决策边界会带来分类损失,可以用损失函数来量化分类损失程度,SVM算法中一般采用Hinge 损失函数(也称合页损失函数),形式如式所示:(9.2)对于整个数据集而言,可以加总Hinge损失得到总体分类损失程度。此时优化问题变为:(9.3)9.2.1 支持向量机 例9.1 Python支持向量机算法应用实例 本例中基于python内置的鸢尾花数据集(Iris),应用支持向量机算法对鸢尾花样本进行分类。鸢尾花通常有山鸢尾、变色鸢尾和维吉尼亚鸢尾三种类别,不同类别的鸢尾花花萼长度、花萼宽度、花瓣长度和花瓣宽度往往不同。因此,选取花萼长度、花萼宽度、花瓣长度和花瓣宽度作为特征变量,类别标签值0、1、2分别代表山鸢尾、变色鸢尾和维吉尼亚鸢尾。将数据集按照3:1的比例划分为训练集与测试集,利用训练集数据训练一个线性SVM模型,在Python中可利用scikit-learn库实现。9.2.1 支持向量机Python代码演示from sklearn import datasets, l
您可能关注的文档
- 人民大金融计量学:基于R和PYTHON教学课件10.pptx
- 人民大金融计量学:基于R和PYTHON教学课件9.pptx
- 人民大金融计量学:基于R和PYTHON教学课件8.pptx
- 人民大金融计量学:基于R和PYTHON教学课件7.pptx
- 人民大金融计量学:基于R和PYTHON教学课件6.pptx
- 人民大金融计量学:基于R和PYTHON教学课件5.pptx
- 人民大金融计量学:基于R和PYTHON教学课件4.pptx
- 人民大金融计量学:基于R和PYTHON教学课件2.pptx
- 人民大金融计量学:基于R和PYTHON教学课件1.pptx
- 汽车维护与保养PPT课件学习情境一 汽车维护工具的使用 任务一 汽车常用工具的使用.pptx
文档评论(0)