mobility可视化的总结x.docVIP

下载本文档

12
0
约 6页
2017-09-10 发布于广东
举报
版权申诉

mobility可视化的总结x.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

关于mobility可视化的总结（3.14）关于宏观稳定分布背后微观个体属性的变化，学者提出了很多的展示手段和方法。将微观变化指数化的思想很早就有人研究，其中最为著名的是fields和o.k.提出的mobility的计算指标。经过后来学者的发展，关于mobility指标的计算已经很成熟：现在已经有绝对流动性、相对流动性的划分。相对流动性在归一化的时候很有优势，便于比较，这就是很多人喜欢使用相对流动性的原因。如何把相对流动性展示出来，是很多学者关心的问题。目前可见的有三个方法：1. 英国学者Batty的rank clock是一个展示排名变化的手段。2. 卢森堡人口、贫困与公共政策中心的Kerm利用利用stata软件对收入流动性进行了图示。3. 我们通过mobility构建网络，利用我们构建的网络展示mobility。其中一个节点表示一个个体，一条边表示两个个体有过一个位置的变化，这样构建的网络的度分布就表示该个体在两次考察时与多少个个体发生了位置变化，也就是单一个体的流动性。所有节点的度的平均值就是我们所说的mobility index。根据我们通过mobility构建的网络，我们就可以在复杂网络的视角下研究我们目标：比如企业规模、股票市场、收入阶层划分等等。我这几天对2010年和2011年中国企业500强利用流动性进行了网络构建，构建的网络和度分布见下图由于上图中的节点过多，我们打算对企业进行精简，我们只拿出2010年和2011年中国企业100强进行分析，构建的网络图如下这张图是通过ＧＮ算法对网络进行了分类的结果，我们可以明确的看出2011年中国100强企业的在2010年和2011年之间的排名的变化，可以分为四类：1. 孤立的点，表示两年排名没有变化。2. 蓝色和黑色的点，表示这两组中的两个企业进行了邻位交换。3. 灰色的点由排名12-22位的企业组成，这些企业构成了一个小社团。4. 粉红的为我们企业100强的主体，占有78个企业，我们可以通过剔除前面的孤立点和小社团的办法，重新对网络进行划分和聚类。我通过程序计算了中国500强企业mobility变化所构建网络的度分布，如下图所示：主图为对X轴和Y轴取对数得到的结果，而小图中为Y轴取对数，X轴为普通坐标时的图，根据这个图的特性，可以被拟合成高端幂律分布低端指数分布的一种复合分布。值得注意的是，每两年通过mobility构建的网络的度分布基本一致，其中平均度分别为（其中2002指代2002-2003）年份 2002 2003 2004 2005 2006 2007 2008 2009 平均度 21.028 20.997 22.195 21.4 20.524 20.569 20.635 20.812 另外，关于mobility是否随排名变大而变大的讨论：由于我们猜想随着mobility随着其企业在500强中的排名数值增大而增大，我们可以直观的想到，第一名的企业变化10个名次肯定比排名400名的企业变化10个名次出现的几率小。那么，mobility是不是会随着rank增大而增大或者是呈现出某种正相关呢？我利用实证数据对mobility和rank进行了图示和计算相关系数，但是结果并不如我们想象到的那么好。我个人觉得原因是：由于我们计算mobility的时候，要求一个企业必须在先后两年同时出现，如果在某一年没有出现，我们就会将这一个企业排除在计算mobility的序列。而排名在400以后的企业可能很快就从400掉出500强榜单，所以很多排名数值很高的企业的排名变化没有统计进去，导致了结果不好。我们需要构建一个封闭的系统来考虑个体的mobility是不是随着排名增大而增大。于是，我将2002-2010年所有的中国企业500强数据进行了新的分析，抽出了这9年都存在中国企业500强榜单的企业，得到了147个企业，这147个企业构成了一个封闭的企业群体，我用其来讨论mobility对排名数值的变化关系。首先：我们需要重新检查一下我们抽取的企业的规模分布是不是还如同500强企业一样服从zipf分布。通过上图我们发现，我们抽取出的147个企业组成的企业榜单，依旧是符合zipf分布的，我们可以这么理解，由于zipf分布是scale free的，所以从中抽取出的一部分依旧具有scale free的特性。那么我们接下来考虑它的排名变化和排名之间的关系：通过上面这幅图我们可以看出，排名变化并没有随着排名数值的增加而完全增大。通过计算相关系数，我们知道，排名变化和排名数值之间存在正相关关系。我对其进行了线性拟合，结果如下图所示。我们知道了实证数据的结果，我们要对Gibrat模型与实证数据一起进行讨论。首先简单介绍一下Gibrat模型：Gibtat模型也叫做Gibrat的比例增