- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
金融建模k-均值聚类模型
基于K-mean聚类的高频数据挖掘实例模型背景K-均值聚类算法,是数据挖掘十大经典算法之一。其主要任务是根据样本数据的特征指标,把数据划分为k个类,使得同类的样本特征尽可能的相似,不同类的样本特征尽可能大的相异。本模型将该算法应用于高频数据,提取上证50指数样本股,2013-03-04至2013-03-08共5天的15分时数据。首先采用K-均值聚类算法,将前3天价格波动曲线相似的股票进行归类,这里将上证50指数成分股划分为4类。其次,针对每类样本股票,以2013-03-07日开盘后1个小时内的成交量加权平均价买入,2013-03-08日收盘前1个小时的成交量加权平均价卖出,计算其收益率。最后,找出收益率为正的类,观察该类的股票样本价格曲线形态,以便找出有利于投资决策的价格曲线形态或进一步的深入研究。本模型作为了一个例子,旨在引导学生或教师或研究员更深入的研究该模型、学会金融高频数据的建模方法及应用于其他的实践案例。本例子详细地介绍了时间序列数据特征的提取方法、基于关键点的降维方法、K-均值聚类算法的迭代过程、matlab绘制图形的编程技术等。这些处理方法,均有matlab程序支持。这里参考了研报《基于模式聚类的短线选股模型--数量化投资系列报告之四十二,国信证券,2011.8》以及期刊《一种基于关键点的时间序列聚类算法,计算机科学,2012年3月第3期》。模型假设为了更好的使用K-mean聚类,对价格数据作了归一化处理。模型公式 K-均值聚类算法如下:A.随机初始化K个聚类中心,即K个类中心向量B.对每个样本,计算其与各个类中心向量的距离,并将该样本指派给距离最小的类C.更新每个类的中心向量,更新的方法为取该类所有样本的特征向量均值。D.直到各个类的中心向量不再发生变化为止,这里采用0.01的误差,作为退出条件。模型意义聚类为数据挖掘、数据分析、模型识别、量化投资相关领域的一项非常重要的任务。K-mean均值聚类算法作为一个经典的算法,掌握其算法理论及实现技术,具有极其重要的意义。步骤1—股票价格序列的特征化处理步骤说明首先:每个股票代码3天的15分时数据共有51个价格数据点,对其归一化。其次,从51个价格数据点中提取12个关键的点(主要目的是降维,提高聚类算法的效率及可靠性,我们一般提取能代表典型趋势价格点),由头+尾+中间10个变化最大的数据点组成(详细的处理方法参见《一种基于关键点的时间序列聚类算法,计算机科学,2012年3月第3期》该期刊)。再次,对提取的关键数据点及原数据点绘制曲线图,以便查看我们选择的关键数据点能否拟合原来的曲线图。最后,对关键的数据点按股票代码,整理为一个统一的结构,便于聚类算法的使用。输入数据预览查看输入的数据,图为部分上证50样本15分时数据返回计算结果图为部分数据,即关键点价格数据。图形展示取前5个股票代码,观察拟合图。这5个股票代码的价格形态各异,其中蓝色为原始数据绘制的曲线图,红色曲线为关键点价格数据绘制的曲线图。从图可以看出,关键点价格曲线基本能拟合原始的曲线图。步骤2—K-均值聚类算法迭代过程步骤说明迭代计算,最后每个股票代码都被划分到指定的类。返回的计算结果步骤3—对每个类的样本计算收益步骤说明针对每个类的样本,以2013-03-07日开盘后1个小时内的成交量加权平均价买入,2013-03-08日收盘前1个小时内的成交量加权平均价卖出,计算其收益。返回的计算结果步骤4—图形展示每个类的价格曲线及收益率步骤说明图形展示每个类的前3天价格曲线图及收益率。返回的计算结果图形展示类1:剧烈的“V”形,并且到达波峰后,已经出现下跌趋势。 类2:波浪式的左高右低斜“V”形,并且未达波峰,同时还在波浪式上扬 类3:已达波峰,并且呈波浪式下跌趋势 类4:已达波峰,并且呈波浪式下跌趋势
您可能关注的文档
最近下载
- 一种具有调节皮肤微生态作用的多糖组合物及其制备方法与应用.pdf VIP
- 一种道路交通视频中敏感信息自动脱敏处理方法及系统.pdf VIP
- 面向对象的系统分析与设计.docx
- 广播电视编导-媒介融合背景下地方传统媒体的转型发展策略.docx
- 一种皮肤屏障修护和细胞修复抗皱组合物及其制备方法.pdf VIP
- 人教部编版七年级下册语文精品课件 第三单元 大概念引领下的大单元复习 (6).ppt VIP
- 一种抗敏消炎纳米组合物及其制备方法和应用.pdf VIP
- 2025北京市地铁运营有限公司公开选拔中层副职领导人员笔试参考题库附带答案详解.docx
- 一种靶向线粒体的自组装硒肽纳米材料及其制备方法和应用.pdf VIP
- 关于大学校园二手交易市场的调查分析.doc VIP
文档评论(0)