- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析和判别分析在投资中应用
聚类分析和判别分析在投资中应用
【 摘 要 】 通过聚类分析给数据进行分类,利用判别分析正确的对已归类个体进行判别。过选取市场投资的股票数据,利用SPSS软件进行数据的聚类分析和判别分析,对分析结果进行评价,更好地帮助人们进行风险的预估和控制。
【 关键词 】 聚类方法;判别分析;决策
1 引言
聚类分析方法是一种分类技术,在数据分类情况未知的情况下,对数据的结构进行分类,主要使用系统聚类法和K-均值聚类法进行研究。系统聚类法分为Q型聚类和R型聚类。Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就可以在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数、降低变量维度的目的。
判别分析是根据一批分类明确的样本在若干指标上的观察值,建立一个关于指标的判别函数和判别准则,然后根据这个判别函数和判别准则对新的样本进行分类,并且根据回代判别的准确率评估它的实用性。
通过对股票数据进行实证分析,对不同的股票进行分类,归纳分析各类股票的特点,比较各增长率收益率,从而帮助投资者缩小投资范围降低投资风险。再用股票指标平均值分析各类样本,列表比较各类样本。以此判断个股的优劣。
2 模型分析
2.1 聚类分析
聚类分析在确定分类过程中经常使用Fisher线性判别的方法该方法的基本思路就是投影,针对多维空间中的一点寻找一个能使它降为一维数值的线性函数,然后应用这个线性函数把n维空间中的已知类别总体以及求知类别归属的样本都变换为一维数据,再根据其间的亲疏程度把未知归属的样本点判定其归属。这个线性函数应该能够在把n维空间中的所有点转化为一维数值之后,既能最大限度地缩小同类中各个样本点之间的差异,又能最大限度地扩大不同类别中各个样本点之间的差异,这样才可能获得较高的判别效率。聚类过程原理:(1) 数据预处理(标准化);(2) 构造关系矩阵(亲疏关系的描述);(3) 聚类(根据不同方法进行分类);(4) 确定最佳分类(类别数)。
2.2 判别分析
聚类分析中一般人们事先并不知道应该分成几类,完全根据数据来判定。在判别分析中,至少有一个已经明确知道类别的训练样本,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。
3 实证分析
使用2014年12月同期股票财务指标数据,该数据的来源是证券之星财经门户网站所提供的数据,证券之星是经过国家质量体系认证的互联网企业,专门从事投资理财的服务平台,数据来源的专业性、及时性、丰富性相对可靠。选取数据是按照最能体现股价水平的最基本最重要的指标,选取的数据在没有重复股指时间跨度尽量小的前提下尽可能多的增加样本量,数据区间是从12月月底至10月月初之间的数据。以下选取了114家股票样本,其中剔除了数据统计不完整的一些样本。分别给出了每股的收益、每股净资产、每股经营的现金流、主营收入增长率、主营利润增长率、净资产收益率等个股的指标数据,来实际分析股票是否具有投资价值。对股票数据进行聚类分析,是将股票分为各个不同的等级,判别分析是判定各个等级之间是否有显著的差别,即判别各等级分类是否准确。
在SPSS数据编辑窗口主菜单选择“分析(A)”→“描述统计”→“描述性分析(D)”经过标准化后的数据如图1所示。
使用系统聚类中的Q型聚类,系统聚类分析方法采用组间连接聚类方法,度量标准区间是平方欧式距离。如图2所示。
用SPSS19中的系统聚类方法对收集到的114个数据进行聚类,生成的树状聚类图。由树状聚类图可以将样本大体分为三类:第三类是厦华电子,第二类是万里股份和邦股份、王府井。之所以将这些股票分为三类,是分析树状聚类图,一是看分成几类比较合适,在合适的前提下看分析人员的需求,股民若是需求更加精细的分类则可以分更多的类,若是只需要从中选出绩差股,则可以分比较少的类,在这里分成三类会更便于比较和对比,使股票之间的差别更加明显的分辨出。第一类是其他的剩余公司。盈利能力的大小决定股票价值的高低。成长能力的高低表明该股票投资潜力的大小,成长性好的上市公司,在总资产扩张能力,股本扩张能力资产重组方面都比较强,盈利增长速度也比较快,经营业绩良好的公司其股本的扩张能力也比较强,扩张能力越大公司提高回报的潜在能力越强,净资产收益率正好表明这种潜在能力的生长比率。
分别以1,2,3代表第1 到3 类,进行判别分析,定义分组变量取值范围为[1,3],分组标志即为上述分类结果;判别函数自变量取原标准化6 个变量,得到判别分析标准数据表,对其应用SPSS 进行判别分析。判别方式选择“一起输入自变量”,
您可能关注的文档
- 职场需求导向人力资源管理教学改革研究.doc
- 职场霸凌对员工破坏行为影响消极情绪与心理复原力作用.doc
- 职工业务技能与岗位要求矛盾原因分析与对策.doc
- 职工专业技术和职业技能发展通道设计与应用.doc
- 职工之家建设实践与思考.doc
- 职工书屋在工会职工素质提升平台中作用探究.doc
- 职工休闲体育现状分析及发展研究.doc
- 职工互助补充保险与 三不让承诺融合初步探讨.doc
- 职工体检冠心病心电图分析.doc
- 职工体育在企业文化建设中积极作用.doc
- 4《猜字谜》课件(共30张PPT).pptx
- 统编版语文二年级上册第三单元复习课件(共50张PPT).pptx
- 2025-2026学年山西大学附中高三上学期10月月考数学试题及答案(总第四次).docx
- 第四单元《逻辑的力量》课件(共57张PPT)2025-2026学年统编版高中语文选择性必修上册.pptx
- 2025-2026学年山西大学附中高三上学期10月月考历史试题及答案(总第四次).docx
- 统编版语文四年级下册习作 游______课件(共27张PPT).pptx
- 统编版四年级语文下册第六单元习作:我学会了___课件(共31张PPT).pptx
- 16.1《赤壁赋》课件(共59张PPT)2025—2026学年统编版高中语文必修上册.pptx
- 统编版四年级语文下册口语交际:朋友相处的秘诀 课件(共20张PPT).pptx
- 统编版五年级下册语文园地四 课件(共30张PPT).pptx
最近下载
- 《2025年城镇排水管道注浆法修复工程技术规程》知识培训.pptx VIP
- 基本药物制度政策培训课件.docx VIP
- 中医医院中医护理工作指南.pdf VIP
- DB65T3843.7-2015 棉花生产全程机械化技术规程 第7部分:采收作业.pdf VIP
- 曲线的切线问题教学设计-2024-2025学年高二上学期数学苏教版(2019)选择性必修第一册.docx VIP
- 【TCP云架构】腾讯云架构高级工程师认证题(附答案).doc VIP
- 软件架构规划与设计.docx VIP
- 2006年考研英语二真题及解析.pdf VIP
- Intel82599ES芯片10G万兆以太网控制器E10G42BTDA归纳.pdf VIP
- 2024学年度人教版四年级数学上册期末测试卷(十四)(可打印,下载可编 完整版.pdf VIP
原创力文档


文档评论(0)