- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
钢铁行业股票的聚类分析
摘要
随着经济的发展,人们已经越来越关心股票这一高风险高收入的投资项目,对此,本文运用多元统计办法,通过考察钢铁行业的一些相关指标数据,运用聚类分析理论中最成熟的系统巨雷方法,对这些指标数据进行分析,得出结论,帮助投资者选择最佳股票。
关键词:总资产,主营业务收入,聚类分析,风险性
导言
股票至今已有将近400年的历史,它最早出现在资本主义国家,是社会化大生产的产物。发展到现在,股份有限公司已经成为资本主义国家最基本的企业组织形式;股票已经成为资本主义国家业筹资的重要渠道和方式,亦是投资者投资的基本选择方式;而股票的发行和市场交易亦已成为资本主义国家证券市场的重要基本经营内容,成为证券市场不可缺少的重要组成部分。同时,股份公司,股票和股票市场不是资本主义所持有的。我国是一个社会主义国家,在发展有计划商品经济的条件下,同样可以利用股份公司的企业组织形式,股票筹资的方式和股票市场的调节机制,为发展社会主义的有计划的商品经济服务。对国家来说,股票具有多方面的积极作用,它可以广泛地动员,积聚和集中社会的闲散资金,可以为改革完善我国的企业组织形式探索一条新道路,可以促进我国经济体制改革的深化发展,还可以扩大我国利用外资的渠道和方式,增强对外的吸纳能力等。同时有利于股份制企业建立和完善自我约束,自我发展的经营管理机制,有利于股份制企业筹集资金,满足生产建设的资金需要。对广大的投资者来说,可以开拓投资渠道,扩大投资的选择范围,适应了投资者多样性的投资动机,交易动机和利益的需求,一般来说能为投资者提供获得较高收益的可能性。但是由于股票价格既受政治,经济,市场因素的影响,亦受技术和投资者行为因素的影响,因此,股票股票价格经常处在频繁的变动之中。股票价格频繁的变动扩大了股票市场的投机性活动,使股票市场的风险性增大。股票投资是一种风险与收益相当的投资行为,所以对于股票的选择必须慎重考虑。本文就钢铁这一行业的股票进行分析。考虑同一行业在国际和国内环境的相似性,以及国家政策的同等性,在文中只对该上市公司及其股票的一些指标进行分析,得出相应的结果。并提出一些建议。
模型分析的原理及其思想
2.1聚类分析的基本思想
聚类分析又称集群分析,是研究如何将客观事物合理分类的一种数学方法。它是根据食物本身的特性对被研究对象进行分类,使同一类中的个体有较大的相似性,不同类中的个体有较大的差异。它与判别分析同属类分析问题。聚类分析根据分类对象的不同,可分为样本聚类和变量聚类。样本聚类在统计学中又称为Q型聚类,它是根据被观测的对象的各种特性,对各变量值进行分类。变量聚类在统计学中又称为R型聚类,反映同一事物特点的变量有很多,我们往往选择部分变量对事物的某一方面进行研究。
与多元分析的其他方法相比,聚类分析是从事物数量上的特征出发对事物进行分类,是数值分析学和多元统计技术结合的结果,是一种较粗糙的、理论并非完善的分析方法,但是其使用简便,分类效果较好,是常用的探索性分析工具,解决许多实际问题,所以很受人们的重视,同回归分析、判别分析一起被成为多元统计分析的三大方法。
2.2聚类分析的分类
聚类分析主要包括有:二阶段聚类、K中心聚类、层次聚类(系统聚类)
二阶段聚类;二阶段聚类模型是一种新型的分层聚类算法,目前一般应用在数据挖掘与多元统计的交叉领域—模式分类中,其算法适用任何尺度的变量。
K中心聚类:K中心聚类为一种快速聚类方法,适合处理大样本数据。K中心聚类要求聚类变量为数值变量,研究者事先需要制定分类数K,各分类中心的初值可以由研究者指定,也可以由程序自动给出。K中心聚类采用迭代算法,不断调整各分类中心位置,直到收敛。
层次聚类(也称系统聚类)是实际工作中使用最多的一种方法。层次聚类法的层次含义是:开始时每个样品各看成一类,将距离最近的两类合并;重新计算新类与其他类的距离,再将距离最近的两类合并;再计算新类与其他类的距离,这样一步步地进行下去,每一步减少异类,直至所有的样品都合并成一类为止。整个聚类过程可绘成聚类图。类与一类之间的距离有各种不同的定义方法,定义不同即产生不同的算法,而不同的算法可能聚得不同的结果。选用何种结果合适,可以结合专业知识帮助判断。
类间平均法,倾向合并偏差较小的类。
类内平均法,倾向合并偏差较小的类
最邻近距离法,适用于非常离散的资料
最远距离法,为前两种方法的折中
中心法,分类效果较差,但稳健,对异常值不敏感
离差平方和法,倾向得到各类样品数目接近的分类结果分类效果好但对异常值敏感。
2.3分析方法
这次设计用的是聚类分析方法中理论比较成熟的系统聚类法。有雨类与类之间有以上几种距离的定义,所以系统聚类法主要有五种,分别为最短距离法、最长距离法、重心法、类平均法以及离差平均和法。本次分析用了五种方法对数据进行分析后选取一
文档评论(0)