中国工业企业数据库以及海关贸易数据库合并方法概述.docVIP

中国工业企业数据库以及海关贸易数据库合并方法概述.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
  中国工业企业数据库以及海关贸易数据库合并方法概述   摘要:随着国际贸易理论的发展以及微观计量经济学的引入,越来越多的研究关注到了微观企业行为在国际贸易中起到的作用,中国经济学者越来越重视微观数据的开发和使用。其中,中国工业企业数据库和海关贸易数据库成为国内外学者研究中国企业在国际贸易中行为和绩效的主要数据库。但是,将企业层面的生产数据和产品层面的贸易数据合并会面临一定的技术问题。两组数据库的编码系统完全不同,企业数据库中企业编号为9位,而贸易数据库中企业编号为10位,将两个数据库匹配起来是有困难的。本文介绍了将两个数据库合并的几种方法,并给出了各种方法匹配出来的效果。 关键词:中国工业企业数据库海关贸易数据库合并 一、中国工业企业数据库和海关贸易数据库使用概况在经验研究中,企业级和产品级的微观数据正在受到越来越多的重视。数据是经验研究的根本,因此数据质量的好坏直接决定了经验研究的质量。其中,中国工业企业数据库和海关贸易数据库成为国内外学者研究中国企业在国际贸易中行为和绩效的主要数据库。他们的研究成果广泛的发表在国内著名学术期刊上,包括《经济研究》、《管理世界》、《经济学(季刊)》、《世界经济》等。   杨汝岱在《区位地理与企业出口产品价格差异研究》中用两个数据库 从区位地理的角度解释中国出口产品的价格差异,越偏远的地方,企业出口产品的价格相对越低,初步反映出我国出口产业的梯度分工模式。余淼杰在《企业出口强度与进口中间品贸易自由化:来自中国企业的实证研究》一文中,使用中国制造企业数据和贸易数据,发现企业面临的中间品关税的下降显著提高了企业的出口强度,即出口占销售的比例。戴觅在《中国出口企业生产率之谜:加工贸易的作用》一文中,通过2000―2006年企业―海关数据的分析表明,中国存在“出口企业生产率之谜”完全是由中国大量的加工贸易企业导致。除此之外,还有一系列研究运用中国工业企业数据库和海关贸易数据库得出了很好的结论。   但是,将企业层面的生产数据和产品层面的贸易数据合并会面临一定的技术问题。两组数据库的编码系统完全不同,企业数据库中企业编号为9位,而贸易数据库中企业编号为10位,将两个数据库匹配起来是有困难的。并且,两个数据库原始数据存在很多问题,如样本匹配混乱、指标缺失、变量大小异常、侧度误差明显和变量定义模糊等严重问题。本文介绍了将两个数据库合并的几种方法,并给出如何整理数据,剔除异常值的步骤和建议。   文章余下部分安排如下:第二部分简要介绍了两个数据库的特征第三部分介绍了两个数据库的并方法第四部分是结论和建议。   二、两个数据库基本介绍   (一)中国工业企业数据库的基本介绍   中国制造业企业数据库由国家统计局建立,它的数据主要来自于样本企业提交给当地统计局的季报和年报汇总。包括2000年到2006年每年约 230000个制造业企业的生产信息。这套数据包括了3张会计报表:损益表,资产负债表和现金流量表,共100多个会计变量。这套数据每年涵盖的企业生产总值占中国总工业生产总值约95%,实际上《中国统计年鉴》中的加总的工业数据就是从这套数据加总而来。数据包括两大类型企业,所有国有企业以及年销售额在500万元以上的非国有企业。企业数目从2000年的162885家增长到了2006年的301961家。   (二)海关贸易数据库的基本介绍   海关数据库包括了2000-2006年产品层面交易的月度数据。每个产品都是在HS8位码上,产品数量从2000年1月的78种增加到2006年12月的230种,每年平均的观测值数目由2000年的1000万增加到2006年的1600万,最终这7年的观测值总数约为118333831个,大约有286819家企业参与了国际贸易。   三、两个数据库合并的方法   (一)按企业名称对接两个数据库   根据企业的姓名和年份匹配,在同一年的两套数据中有相同的名字则认为是同一个企业。年份这一变量对于匹配是重要的,因为一些企业在不同年份企业名称可能不同,并且新进入的企业有可能采用他们原来的名称。   《中国的多产品出口企业及其产品范围:事实与解释》采用此种方法,目的是为了剔除中间商。同时出现在海关数据库和工业企业数据库中的企业必然不是纯粹的中间商,因此留下来的样本就是剔除了中间商的样本。   用此种方法合并,最后得到2000-2005年的企业数量分别为22631,26038, 30629,37103,42259,44136家。合并后的数据库企业出口额达到了原海关数据中出口额的60%。这样,合并后的数据就近包括有出口行为的工业企业的进出口和企业的投入产出信息。   两篇文章匹配出的结果一样。   (二)使用邮政编码和电话号码对企业进行识别通过企业的邮政编码和最后7位电话号码进行匹配,因为在每一个邮政

文档评论(0)

mbxy007 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档