基于电信大数据的流动人口数据特征分析.docVIP

基于电信大数据的流动人口数据特征分析.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于电信大数据的流动人口数据特征分析.doc

基于电信大数据的流动人口数据特征分析   【摘要】 我国流动人口呈现出规模持续扩大,人口结构日益复杂化的趋势,但是目前的流动人口统计方法明显滞后,不能满足各级政府和社会各界对流动人口数据的需求,亟待结合大数据分析方法进行改进。而随着智能手机等移动终端的普及,电信运营商获取了用户身份、通讯记录、地理位置等海量客观数据,本文将结合电信运营商获取的数据信息分析流动人口所表现出的数据特征,为统计流动人口提供判定思路。   【关键词】 电信大数据 流动人口 价值分析 判定   一、引言   流动人口指离开户籍所在地的县、市或者直辖区,以工作、生活为目的异地居住的成年育龄人员,对某个城市而言,包括流入人口和流出人口,人口的流入和流出情况在一定程度上反映出当地的经济发展情况,也对当地造成一系列的社会经济影响,包括人力资源的分布变化、对公共设施配备的需求增加、对城市建设的影响等。目前常用的流动人口统计方法主要包括人口普查、人口抽样调查、构建流动人口信息平台等方法,缺乏实现快速动态监测、短周期内流动人口规模测度统计的有效方法和策略。若要对某城市实现以上统计目标,需实时获取城市范围内所有人员有关原户籍、现所在地等个人信息,传统方法很难在短时间内获取相关数据,而这对电信运营商来说却是易于反掌,原因在于移动的基站系统和实名制注册要求。据工业和信息化部统计,截止2015年4月,我国移动用户数总规模接近12.93亿户,而全国总人口为13.6亿人,移动电话普及率已达95.07部/百人,接近人手一部手机。对于流动人口而言,无论其流动方向而言,总会通过移动通信与家里留守的亲人保持联系,这使得流动人口的统计特征与移动通信数据保持基本一致,为应用电信大数据统计流动人口提供了较强的理论和数据支持。   二、电信大数据的类型分析   电信运营商的数据具有十分宝贵的研究价值,包括用户身份信息、设备终端数据,出于对在网客户进行服务计费的需要,运营商实时记录用户上网数据、所在位置数据、通信数据等内容。   (1)用户身份信息:包括用户姓名、年龄等个人信息,业务订购,积分获取等数据。在逐步实施用户实名制之后,运营商拥有了较为准确全面的用户个人资料,身份证号信息提供了用户的出生地信息,是进行流动人口统计的主要数据基础。(2)设备终端信息:主要记录用户终端的数据信息,包括品牌、型号以及手机终端的性能信息。(3)用户行为数据:记录用户的通话、数据上网、收发短信等行为,以通话为例,记录是否主被叫,通话时间、时长,是否漫游,对方号码归属地等信息。由于流动人群大多数存在频繁与户口所在地进行通信的现象,因此通话行为数据可被用来作为统计流动人口的依据。(4)用户位置数据:为保证用户能接打电话,手机终端需要与移动基站不停地进行呼叫通信,运营商可根据通信基站确定用户所处的大致范围,而随着用户位置的改变,网络会进行基站切换和位置更新,这就形成了特定时间内用户位置的移动轨迹。研究检测用户在某个时间范围内的位置变化也是流动人口研究的统计依据。综上所述,电信用户入网登记的身份信息,在网期间所产生的行为数据和位置数据对统计流动人口有重要的应用价值。   三、流动人口电信数据的表现特征   对某一特定区域而言流入人口和流出人口,在身份信息、行为数据和位置数据方面表现出不同的数据特征,以下将分别进行分析:(1)流入人口的数据特征分析。1、身份信息:实名认证客户的身份证信息中前六位所对应的出生地区域代码与电信运营商所在地不一致,可根据其统计流入人口的来源地区分布;2、位置信息:在春节、五一或国庆等节假日期间,出于与亲友团聚的目的,运营商检测到的流入人群所处基站位置信息发生明显变化,显示区域与身份信息所在地一致;3、用户行为数据:流入人群与其身份证记录的外地区域客户有频繁的长途通话、收发短信等行为。节假日期间,流入人群在身份证显示区域有漫游通话的情况。(2)流出人口的数据特征分析。1、位置信息:流出人口的身份证出生地信息显示为本地;2、位置信息:在春节等节假日期间,流出人口有回流情况,即所在基站位置与出生地一致;3、用户行为数据:流出人口与本地区域客户有较高频率的长途通话;节假日期间,客户漫游地区与本区域一致。   总结:电信运营商在提供移动通信业务的过程中, 获取了海量真实的客户历史数据, 客观反映了用户的真实身份信息、位置信息和消费行为,结合流动人口的消费、移动等行为特征,本文研究分析了流入、流出人口电信数据的特定表现特征,为进一步应用电信大数据统计流动人口数量提供了参考依据。   参 考 文 献   [1] 智勇,盛昭翰. 基于移动通信信息资源的人口流动趋势研究[J]. 山东社会科学, 2009(11).   [2] Liu P. 电信行业中的大数据. 电信网技术[J],

您可能关注的文档

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档