稳健性因子分析在股票评价中的应用1张应应2重庆大学数学与.docVIP

下载本文档

13
0
约1.69万字
约 12页
2017-09-01 发布于天津
举报
版权申诉

稳健性因子分析在股票评价中的应用1张应应2重庆大学数学与.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

稳健性因子分析在股票评价中的应用1张应应2重庆大学数学与

稳健性因子分析在股票评价中的应用张应应 (重庆大学数学与统计学院统计与精算学系，重庆市401331) 摘要：本文利用面向对象的稳健性因子分析R软件包robustfa，对沪市9家上市公司201年季度财务报表中的十个主要财务指标进行了因子分析。通过使残差矩阵的元素平方和达到最小，我们发现了一个组合——与稳健性Sde估计量。通过由稳健性Sde估计量计算的马氏距离大于临界值，我们发现共有个异常点。本文发现用经典估计量和稳健性Sde估计量计算的样本相关阵、旋转后的因子载荷矩阵、因子对原始变量的贡献、贡献率、累积贡献率、样本相关阵的特征值的碎石图、前两个因子得分的散点图、因子得分、按因子得分排序等结果均有较大的不同。最后本文与稳健性Sde估计量将十个财务指标归结为三个因子，根据每个股票的三个因子得分情况对该股票作出综合评价。关键词：稳健性；因子分析；面向对象；股票；财务报表中图分类号：O212 文献标识码：A 引　言异常值实质上存在于任何应用领域的任一数据集。为了避免异常值的影响，需要使用稳健性估计量。多元均值和协方差阵的经典估计量是样本均值和样本协方差阵。如果数据来自正态总体的话，它们是最优的估计量，但是它们对异常值非常敏感。如果数据中有异常值，异常值会影响样本均值和样本协方差阵，从而会影响依赖于它们的经典因子分析[]。因此有必要考虑使用样本均值和样本协方差阵的稳健性估计量。文献中现存几种稳健性估计量，它们是：MCD[,]，OGK[]，MVE[2]，M[]，S[,,,5,]和Stahel-Donoho[,,,]。把样本均值和样本协方差阵的经典估计量换成稳健性估计量是稳健化多元分析的最直接的方法[,]，这也是我们稳健化因子分析所采用的方法。进行稳健性多元分析的基本软件包是robustbase[]。还有一个与robustbase有较大重叠的软件包是robust[]。rrcov[]软件包构建于robustbase上面，rrcov提供了许多好的基于S4类的方法，rrcov中包含了几乎完整的计算具有稳健性的样本均值和样本协方差阵的估计量，还包含稳健性主成分分析、稳健性线性及二次判别分析。本文使用的软件包robustfa[]，是仿照rrcov创建的一个解决稳健性因子分析相关问题的软件包。本文所采用的数据是上证A股2013-09-30三季度财务数据，共有957只股票（样本），10个财务指标（变量），数据下载自免费的大智慧软件。王学民[,]曾经对上市公司财务报表中的众多指标利用因子分析,,22]进行降维，在作因子分析之前为了消除异常值的影响，人为的去除了一些样本点。为了更加客观地对待每一个样本点，本文采用稳健性因子分析。与王学民[21]所使用的10个上市公司财务量化指标一样，包括：主营业务收入(x1，元)、主营业务利润(x2，元)、利润总额(x3，元)、净利润(x4，元)、每股收益(x5，元)、每股净资产(x6，元)、净资产收益率(x7，%)、总资产收益率(x8，%)、资产总计(x9，元)、股本(x10)。需要说明的是，大智慧软件中没有总资产收益率这个指标，但它可以由公式计算得到。本文采用R软件]进行计算。实证分析从1可以看出异常点在经典因子分析中的影响。我们所采用的数据是经典的Hawkins，Bradu and Kass (hbk)数据集，它来自软件包robustbase，有75个样本，4个变量（一个响应变量，三个解释变量）。前10个样本是坏的杠杆点，11-14样本是好的杠杆点（即：它们的x部分是异常的，但是它们的y部分对模型拟合得很好）。在这里我们只考虑hbk数据集的x部分。左图显示的是经典因子分析前两个因子的散点图，前两个因子解释了总方差的99.4%。异常点（1-14）被有效地区分了出来，但是正常点远离原点（从1可以看得更加清楚。因子得分的样本均值理应在原点，因为因子得分是从样本相关阵出发计算的）。此外，97.5%的置信椭圆没有覆盖正常点，这表明置信椭圆被异常点严重地影响了（注意：经典因子分析的置信椭圆并不一定要比稳健性因子分析的置信椭圆大，置信椭圆的大小由特征值的大小确定）。右图显示的是稳健性因子分析前两个因子的散点图，前两个因子解释了总方差的71.5%。我们发现稳健性因子得分的样本均值没有受到异常点的影响，并且异常点被97.5%的置信椭圆很好地区分开来。进一步计算因子得分的样本均值（结果见1），我们发现：经典因子分析的因子得分在所有点的样本均值为0，而在正常点上不为0；稳健性因子分析的因子得分在所有点的样本均值不为0，而在正常点上为0。 1. hbk数据集前两个因子的散点图: 经典的和稳健性的. 1. hbk数据集前两个因子得分的样本均值. Factor1 Factor2 经典因子分析在所有点 3.700743