- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
湖南电子商务企业发展实证研究
湖南电子商务企业发展实证研究
基于三经普企业信息化数据
湖南省统计局 任全、殷进、余奕佳
摘 要
采用三经普27470家法人单位数据,运用随机森林、AdaBoost算法、关联规
则等多种分析方法和R软件,挖掘企业电子商务发展的主要内部影响因素,如信
息化程度、区域位置、财务状况、人员情况等企业特征的模型关系。试图通过企
业的内部情况对企业是否会发展电子商务进行判别,得出若企业要发展电子商
务,需要在哪些方面加大投入。结果表明,电子商务的发展与企业网站的拥有情
况、互联网的应用和信息技术专业人员数量有极大的相关性,发展电子商务要加
强网站建设和网络应用,增加信息技术型人才。本次分析为推断和预测企业今后
电子商务发展方向提供了指导性的建议,同时构建了政府统计大数据挖掘的新思
路。
关键词:电子商务 应用研究 AdaBoost算法 随机森林 关联规则分析 R
目 录
前 言 1
一、研究背景及思路1
二、数据来源及预处理1
(一)数据来源1
(二)数据预处理2
1.财务报表数据处理。2
2.企业基本情况与信息化情况表数据处理。5
3.三类报表数据集成6
三、变量选取6
(一)企业财务状况变量选取6
(二)企业基本情况变量选取。6
(三)企业信息化情况变量选取。6
(四)企业人均情况变量选取。7
(五)因变量指标:7
四、探索性数据分析8
(一)变量基本情况分析8
1.企业基本情况变量 8
2.企业信息化情况变量 10
3.企业人均情况变量 11
4.企业财务情况变量 11
(二)变量相关性分析12
五、模型构建13
(一)基于企业内部因素对企业电子商务发展选择的分类分析13
1.模型选择13
2.基于随机森林的电子商务企业分类分析15
3. 基于AdaBoost 算法的电子商务企业分类分析18
4.分行业数据随机森林分析19
(二)企业内部因素影响效果的关联规则分析21
1.数据分箱22
2.设定后继项为电子商务企业的关联规则分析23
3. 设定先导项为电子商务企业的关联规则分析27
六、总结与展望27
(一)论文总结27
(二)下一步分析方向28
(三)研究不足和政策建议 28
0
前 言
随着信息技术的迅猛发展,电子商务成为增强企业竞争力和促进经济发展的
重要驱动。目前,国内外学者们在企业信息化程度等内部因素对电子商务影响方
面的研究还很少。通过2013年第三次经济普查数据,对湖南省具有电子商务交易
行为和其它企业的基本情况、财务状况、人员情况及信息化程度进行详细的调查
研究和量化分析,为政府开展电子商务统计,制定相关政策提供依据;同时也为
企业发展电子商务提供基础数据和理论支撑。
一、研究背景及思路
作为信息时代经济发展的一项综合性动力因素,电子商务正在对经济产生积
极正面的影响,它从生产、销售、消费等方面改进或改变了传统的经济方式,使
经济体之间的交流渠道更顺畅、信息反馈更快速,极大地促进了社会经济增长方
式的转变和优化。选取湖南限额以上企业基本情况、信息化及财务等数据指标,
通过决策树、Bagging、AdaBoost、随机森林、支持向量机等算法建模,寻找最
优分析方法,探讨企业内部因素对电子商务影响的重要程度,进一步运用关联规
则分析企业信息化因素及内部运营条件等对具有电子商务交易行为企业的具体
影响,以期找到湖南电子商务发展规律,为政府统计和企业发展提供决策参考。
二、数据来源及预处理
(一)数据来源
研究课题数据来源于2013年第三次经济普查资料中调查单位基本情况表、财
务报表以及信息化情况表。研究对象包括全省规模以上工业企业、有资质的建筑
业、限额以上批发零售业、限额以上住宿和餐饮业、房地产开发经营业和重点服
务业等27470家法人单位。其中,信息化情况表是近两年为探索企业信息化情况
特别是电子商务发展情况新增的统计报表。
文档评论(0)