网站大量收购闲置独家精品文档,联系QQ:2885784924

Python金融数据分析与挖掘(微课版) 课件 8-1.基于总体规模与投资效率指标的综合评价.pptx

Python金融数据分析与挖掘(微课版) 课件 8-1.基于总体规模与投资效率指标的综合评价.pptx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第8章上市公司综合评价指标选择、数据处理主成分分析与综合排名投资组合收益率计算与量化投资策略设计

基于总体规模与投资效率指标的综合评价(指标选择)第8章字段名称字段中文名称字段说明Stkcd股票代码Accper会计年度2013-12-31、2014-12-31、2015-12-31、2016-12-31、2017-12-31B001101000营业收入企业经营过程中确认的营业收入B001300000营业利润与经营业务有关的利润B001000000利润总额公司实现的利润总额B002000000净利润公司实现的净利润A001000000资产总计资产各项目之总计A001212000固定资产净额固定资产原价除去累计折旧和固定资产减值准备之后的净额F050501B净资产收益率净利润/股东权益余额F091001A每股净资产所有者权益合计期末值/实收资本期末值F091301A每股资本公积资本公积期末值/实收资本期末值F090101B每股收益净利润本期值/实收资本期末值总体规模指标包括上市公司的营业收入、营业利润、利润总额、净利润、资产总计、固定资产净额,投资效率指标包括净资产收益率、每股净资产、每股资本公积、每股收益,共10个指标包括2013年—2017年的数据,综合评价按年进行,本案例以2016年为例。

基于总体规模与投资效率指标的综合评价(数据处理)第8章(1)读取2016年的数据,其中第0列为标识列(股票代码)importpandasaspddata=pd.read_excel(data.xlsx)data2=data.iloc[data[Accper].values==2016-12-31,[0,2,3,4,5,6,7,8,9,10,11]](2)筛选指标值大于0的数据以及去掉nan值。data2=data2[data20]data2=data2.dropna()(3)数据标准化,注意标准化需要去掉第0列,这里数据标准化方法采用均值-方差法。fromsklearn.preprocessingimportStandardScalerX=data2.iloc[:,1:]scaler=StandardScaler()scaler.fit(X)X=scaler.transform(X)

基于总体规模与投资效率指标的综合评价(主成分分析)第8章对标准化之后的指标数据X做主成分分析,提取其主成分,要求累计贡献率在95%以上。fromsklearn.decompositionimportPCApca=PCA(n_components=0.95)#累计贡献率为95%以上Y=pca.fit_transform(X)#满足累计贡献率为95%的主成分数据gxl=pca.explained_variance_ratio_#贡献率通过主成分分析,可以获得其主成分,接下来就可以根据获得的主成分计算每个上市公司的综合得分了。根据综合得分,可以获得上市公司的综合排名。

基于总体规模与投资效率指标的综合评价(综合排名)第8章1.计算综合得分#综合得分等于提取的各个主成分与其贡献率的加权求和。importnumpyasnpF=np.zeros((len(Y)))#预定义综合得分数组Fforiinrange(len(gxl)):f=Y[:,i]*gxl[i]#第i个主成分与第i个主成分贡献率的乘积F=F+f#数组累积求和2.整理排名结果#第1种方式如下:fs1=pd.Series(F,index=data2[Stkcd].values)#构建序列,值为综合得分F,index为股票代码Fscore1=fs1.sort_values(ascending=False)#结果排名,降序第2种方式如下:co=pd.read_excel(TRD_Co.xlsx)Co=pd.Series(co[Stknme].values,index=co[Stkcd].values)Co1=Co[data2[Stkcd].values]#主成分分析指标数据对应的上市公司名称fs2=pd.Series(F,index=Co1.val

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档