- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
上市公司财务报表稳健性因子分析.doc
上市公司财务报表稳健性因子分析
引言
异常值实质上存在于任何应用领域的任一数据集。
为了避免异常值的影响,需要使用稳健性估计量。多元均值和协方差阵的经典估计量是样本均值和样本协方差阵。如果数据来自正态总体的话,它们是最优的估计量,但是它们对异常值非常敏感。如果数据中有异常值,异常值会影响样本均值和样本协方差阵,从而会影响依赖于它们的经典因子分析[1].因此有必要考虑使用样本均值和样本协方差阵的稳健性估计量。
本文所采用的数据是上证A股2013-09-30三季度财务数据,共有957只股票(样本),10个财务指标(变量),数据下载自免费的大智慧软件。为了更加客观地对待每一个样本点,本文采用稳健性因子分析。使用的上市公司财务量化指标包括:主营业务收入(x1,元)、主营业务利润(x2,元)、利润总额(x3,元)、净利润(x4,元)、每股收益(x5,元)、每股净资产(x6,元)、净资产收益率(x7,%)、总资产收益率(x8,%)、资产总计(x9,元)、股本(x10)。需要说明的是,大智慧软件中没有总资产收益率这个指标,但它可以由公式总资产收益率(x8)=净利润(x4)资产总计(x9)计算得到。本文采用R软件[2]进行计算。
1 实证
从图1可以看出异常点在经典因子分析中的影响。
我们所采用的数据是经典的Hawkins,Bradu and Kass (hbk)数据集,它来自软件包robustbase[3],有75个样本,4个变量(一个响应变量,三个解释变量)。前10个样本是坏的杠杆点,11~14样本是好的杠杆点(即:它们的x部分是异常的,但是它们的y部分对模型拟合得很好)。在这里我们只考虑hbk数据集的x部分。左图显示的是经典因子分析前两个因子的散点图,前两个因子解释了总方差的99.4%.异常点(1~14)被有效地区分了出来,但是正常点远离原点(因子得分的样本均值理应在原点,因为因子得分是从样本相关阵出发计算的)。此外,97.5%的置信椭圆没有覆盖正常点,这表明置信椭圆被异常点严重地影响了(注意:经典因子分析的置信椭圆并不一定要比稳健性因子分析的置信椭圆大,置信椭圆的大小由特征值的大小确定)。右图显示的是稳健性因子分析前两个因子的散点图,前两个因子解释了总方差的71.5%.我们发现稳健性因子得分的样本均值没有受到异常点的影响,并且异常点被97.5%的置信椭圆很好地区分开来。进一步计算因子得分的样本均值,我们发现:经典因子分析的因子得分在所有点的样本均值为0 (3.700743e-18, 4.302114e-18),而在正常点上不为0 (4.545664, 1.874009);稳健性因子分析的 因 子 得 分 在 所 有 点 的 样 本 均 值 不 为 0(-0.3613164, -0.3013054), 而 在 正 常 点 上 为 0(1.069557e-16, 2.832434e-17)。下面我们利用FaCov()函数计算稳健性因子分析。它的一般使用格式为:FaCov(x, factors = 2, cor = FALSE, cov.control = CovControlMcd(), method = c“(mle”,“pca”,“pfa”),scoresMethod = c“(none”“,regression”“,Bartlett”), …)其中x是一个数值矩阵或者是一个可以强制为数值矩阵的对象(如数据框)。factors是因子个数,默认值为2.cor是一个逻辑变量,如果cor = TRUE则用相关阵进行计算,如果 cor = FALSE(默认值)则用协方差阵进行计算。cov.control用来确定用什么样的稳健性估计量来计算稳健性样本均值和稳健性样本协方差阵,它的取值为类为CovControl的对象,默认值为CovControlMcd(),这时所取的稳健性估计量为MCD.如果cov.control = NULL,则用经典的估计量来计算样本均值和样本协方差阵。method是因子分析所用的方法,它的取值为“mle”(默认值,极大似然法),“pca”(主成分法)和“pfa”(主因子法)。scoresMethod表示计算因子得分的方法,默认值是“none”(即不计算因子得分),“regression”表示用回归法计算Thompson因子得分,“Bartlett”表示用加权最小二乘法计算Bartlett因子得分。
既然计算因子分析的方法有“mle”,“pca”和“pfa”3种,而cov.control的取值有CovControlOgk(),CovControlMcd(),CovControlMest(),CovControlMve(),CovControlSde(),Cov-ControlSest()
文档评论(0)