五变量关系定性分析及模型检验-中国统计教育学会.docVIP

五变量关系定性分析及模型检验-中国统计教育学会.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五变量关系定性分析及模型检验-中国统计教育学会

企业营业状态分类预测及分析 ——基于第二次全国经济普查服务业数据 中国人民大学 吴凡、唐君怡、孙璐 中文摘要 企业营业状态一直是社会关心的重点。该项指标主要反映企业(单位)的生产经营状态,包括营业、停业、破产等。本文利用第二次全国经济普查中服务业的数据为例,筛选出对企业经营状态产生重要影响的经济变量,建立分类模型,并使用非参数方法检验模型。一方面通过考察各个经济变量对企业经营状态的不同影响程度及方式,为改善企业经营状态,提高营业收益提供决策依据;另一方面可以依据新的指标变量数据对与某企业的经营状态进行分类预测,以帮助达到检验数据真实度,填补普查数据缺失值等作用,为未来更好地利用全国经济普查数据提供思路。 关键词:分类预测 经济普查微观数据分析 决策树模型 企业营业状态 一 引言 全国经济普查对我国境内从事第二产业和第三产业的全部法人单位、产业活动单位和个体经营户的单位基本属性、从业人员、财务状况、生产经营情况等各指标进行全面统计。普查所得的资料具有其他统计数据不可比拟的全面性和丰富性。我国进行经济普查的目的,是为了全面掌握我国第二产业、第三产业的发展规模、结构和效益等情况,为研究制定国民经济和社会发展规划,提高决策和管理水平奠定基础。 经济普查对服务业各个企业共调查56个指标,各个指标间均存在或大或小的经济关联。企业的营业状态主要反映企业的生产经营状态,而企业的经营状态在很大成度上可以反映企业的经营好坏。企业营业状态的决定因素很多,影响模式也十分复杂。如果可以利用经济普查所得的大量微观数据,以企业生产经营状态为目标变量,筛选对其有重要影响的变量,建立分类预测模型,一方面了解各个经济变量对经营状态产生影响的大小和方式,为企业改善经营状态、提高经营收入提供决策意见;另一方面利用该模型可以在普查过程中对该项统计指标的缺失值进行近似预测,帮助提高数据质量。 二 数据说明 经济普查针对服务业共调查56个指标,可以分为两部分:单位基本情况指标和财务状况指标。 单位基本情况指标主要包括: (1)行政区代码(分类型变量); (2)行业代码(分类型变量); (3)登记注册类型、执行会计制度类别(分类型变量,由于这类变量对于企业经营状况没有本质影响,所以建模时并不考虑这部分变量); (4)机构类型(分类型变量); (5)各类从业人员数(数值型变量); (6)开业(成立)时间(数值型变量); (8)营业状态(分类型变量); (9)控股情况、隶属关系(分类型变量); (10)年末在用计算机数(数值型变量); 其中营业状态是我们要获得的目标变量。如果机构类型=“10(企业)”,营业状态只能选1、2、3、4、5、9之一;如果机构类型≠“10”(20事业单位;30机关;40社会团体;51民办非企业单位;52基金会;53居委会;54村委会;90其他组织机构),则营业状态不能含有任何字符。其中1、2、3、4、5、9分别代表营业(指全年正常开业的企业和季节性生产开工三个月以上的企业)、停业(指由于某种原因已处于停产状态,待条件改变后将恢复生产经营的企业)、筹建(指企业未经工商部门登记开业,正在进行生产经营前的筹建工作)、当年关闭(指当年终止经营的企业,包括关闭、注销、吊销)、当年破产(指当年依照《破产法》或相关法律、法规宣布破产的企业)及其他类型的营业状态。 财务状况指标主要包括: (1)资产总计(数值型变量); (2)年初、年末存货(价值量指标,数值型变量); (3)固定资产原价(数值型变量); (4)所有者权益合计(数值型变量); (5)各类资本:实收资本、国家资本、集体资本、法人资本、个人资本、港澳台资本、外商资本(数值型变量); (6)营业成本、主营业成本(数值型变量); (7)营业税金及附加、主营业务税金及附加、税金、本年应交增值税(数值型变量); (8)主营业务利润、其他业务利润(数值型变量); (9)营业费用、管理费用、财务费用合计(数值型变量); (11)利息支出(数值型变量); (12)营业利润、资产减值损失、公允价值变动收益、投资收益(数值型变量); (13)职工工资和福利费(数值型变量); 三 数据预处理 1 样本筛选 如前所述,只有机构类型为“10”即为企业时才有营业状态这一项指标,所以数据预处理的第一项就是将机构类型为“10”的样本筛选出来。这样在该变量就只有一个取值,所以在建模时可以剔除该变量,减少模型变量。 2 变量重要性分析 由于普查数据变量比较多,所以首先进行变量的重要性分析,考察各个变量对于企业营业状态的影响程度。保留对预测有重要意义的变量,剔除不重要变量和样本,一方面可以帮助浓缩、提炼数据,降低模型运算时间;另一方面精简变量,确定模型的自变量,为下面建模打下基础。 为了能在全面考虑对目标变量有影响的变量的

您可能关注的文档

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档