Python金融数据分析与挖掘（微课版）课件 7-6.基于主成分聚类的上市公司盈利能力分析.pptx

下载文档

4
0
约4.49千字
约 12页
2024-12-17 发布于山东
举报
版权申诉
保障服务

Python金融数据分析与挖掘（微课版）课件 7-6.基于主成分聚类的上市公司盈利能力分析.pptx

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第7章基础案例案例介绍案例分析及计算

案例介绍第7章以申万行业分类表中“计算机”行业所有上市公司2015年的盈利能力指标数据为基础字段名称指标名称说明F050502B净资产收益率B净利润/股东权益平均余额（X1）F050102B资产报酬率B（利润总额+财务费用）/平均资产总额（X2）F050202B总资产净利润率B净利润/总资产平均余额（X3）F051201B投入资本回报率（净利润+财务费用）/（资产总计?流动负债+应付票据+短期借款+一年内到期的非流动负债）（X4）F051501B营业净利率净利润/营业收入（X5）F053301B营业毛利率（营业收入?营业成本）/营业收入（X6）F051401B营业利润率营业利润/营业收入（X7）F052101B成本费用利润率（利润总额）/（营业成本+销售费用+管理费用+财务费用）（X8）采用K-均值聚类算法，将上市公司分为5类，并计算每类公司当年的总利润平均增长率每类公司当年的总利润平均增长率=（该类公司当年的总利润平均值-该类公司上年的总利润平均值）/该类公司上年的总利润平均值。每类公司当年的总利润平均值=（该类别中所有公司当年利润之和）/该类别的公司数量

案例分析及计算第7章1．获取2015年所有公司股票的财务指标数据importpandasaspdimportnumpyasnpdata=pd.read_excel(财务指标数据.xlsx)data2=data.iloc[:,[0,2,3,4,5,6,7,8,9]]

案例分析及计算第7章2．对财务指标数据进行清洗#去掉小于0的指标值和nan值data2=data2[data20]data2=data2.dropna()3．对财务指标数据进行异常值处理#数据转化为Numpy数组的形式，同时每个大于其均值8倍的指标视为异常值，并删掉data2=data2.valuesforiinrange(1,9):data2=data2[data2[:,i]8*np.mean(data2[:,i]),:]

案例分析及计算第7章4．选择“计算机”行业所有上市公司的数据（本步骤可以通过内连接关联获取）从预处理过的财务指标数据中选择申万行业分类表中“计算机”行业所有上市公司的数据。其处理过程分两步。（1）获取申万行业分类表中“计算机”行业所有上市公司的股票代码。dta=pd.read_excel(申万行业分类.xlsx)#申万行业分类表中“计算机”行业所有上市公司股票代码stkcd=dta.loc[dta[行业名称].values==计算机,股票代码].values

案例分析及计算第7章4．选择“计算机”行业所有上市公司的数据执行算法如下：Step1：获取预处理过的财务指标数据data2中的所有代码，s=data2[:,0]。Step2：s循环地与申万行业分类表中“计算机”行业所有上市公司股票代码stkcd做存在性判断。Step3：得到满足判断条件的逻辑数组I，以I作为逻辑索引，取data2表中的元素即可。s=data2[:,0]I=s==stkcd[0]foriinrange(1,len(stkcd)):I1=s==stkcd[i]I=I|I1ddata=data2[I,:]#申万行业分类表中“计算机”行业所有上市公司股票代码对应的财务数据#提取申万行业分类表中“计算机”行业所有上市公司股票码对应的财务指标数据X，用来做主成分分析。X=ddata[:,1:]（2）从预处理过的财务指标数据中选择满足条件的数据。

案例分析及计算第7章5．对指标数据X做标准化处理#这里采用极差法进行标准化。fromsklearn.preprocessingimportMinMaxScalerscaler=MinMaxScaler()scaler.fit(X)X=scaler.transform(X)6．对标准化后的X做主成分分析fromsklearn.decompositionimportPCApca=PCA(n_components=0.95)#累计贡献率为95%Y=pca.fit_transform(X)#提取的主成分tzxl=ponents_#返回特征向量gxl=pca.explained_variance_ratio_#返回主成分方差百分比（贡献率）#对主成分Y做标准化处理（极差法）scaler=MinMaxScaler()scaler.fit(Y)Y=scaler.transform(Y)

案例分析及计算第7章Y1=0.3583×X1+0.377

您可能关注的文档

文档评论（0）

xiaobao + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

Python金融数据分析与挖掘（微课版）课件 7-6.基于主成分聚类的上市公司盈利能力分析.pptx