基于微博舆情数据的震后有感范围提取研究.docVIP

基于微博舆情数据的震后有感范围提取研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于微博舆情数据的震后有感范围提取研 究 摘要:提出了基于微博舆情信息的震后有感范围快速判 定技术框架,构建了微博舆情数据的获取方法和技术流程。 根据中国地震烈度表和地震现场工作调查规范,将微博特征 词与地震灾情速判指标进行关联匹配,建立微博灾情信息分 类指标体系,通过自然邻点空间插值方法将离散分布的微博 灾情点转化为连续分布的灾情面,形成震后灾区有感范围的 时空变化特征分布图,辅助灾情快速判定。以2014年景谷 66级地震为例,进行探索和实践。结果表明:在震后1?2h 内,微博用户活跃度高,信息量大且丰富,对信息充分挖掘 有助于对灾情的宏观把握,对救灾决策部署有一定的参考意 义,弥补了传统获取技术时效性差、数据量少、覆盖面小等 问题。 关键词:微博舆情数据;灾情判定;有感范围提取 中图分类号:P315941文献标识码:A文章编号: 1000-066602-0303-08 0引言 地震发生后,灾情信息的快速获取、处理、分析和研 判是各级党委政府、各级抗震救灾指挥部成员单位部署抗震 救灾工作,派遣救援力量、调配救灾物资的关键环节,尤其 是震后2 h的黑箱期内,如何快速判定灾区影响范围灾情时 空分布、震害规模、强度等是地震应急灾情快速获取及服务 的关键。目前,在震后有感范围确定方面,主要有以下几个 途径:一是通过“三网一员”、政府、地震部门应急人员电话、 传真,网站灾情填报等方式获取灾情,绘制有感范围图; 是根据烈度衰减模型快速计算生成地震影响场来预估灾区 范围和强度;三是基于智能手持采集终端获取地震信息,生 成有感范围分布图;四是通过网络爬虫在网站上获取灾情信 息,通过地址匹配、空间定位解析后插值生成有感范围分布 图。在实际地震应急中,上述几种途径在信息获取的时效性、 获取效率、信息量、空间范围上存在一定的局限性,短时间 内都难以全面客观地反应灾区有感范围的强度和分布,“互联 网+”时代的来临为我们在震后灾情快速获取方面提供了一 种新的解决思路。 根据中国互联网络信息中心发布的《第38次中国互联 网络发展状况统计报告》显示,截至2016年6月,中国网 民规模达710亿,互联网普及率为488%,手机网民规模达 656亿,微博客用户242亿。从统计数字可以看出,随着移 动互联网技术的飞速发展,数量众多的个人成为信息传播的 重要载体。相对于手机信令、浮动车、微信等数据,以新浪 微博为代表的新兴社交平台具有实时性、互动性、强扩散、 空间分布广泛性等特点,微博数据可以在互联网上被免费、 公开地获取。尤其是在破坏性地震发生后数小时内,大量与 地震相关的信息发布并广泛传播,汇集形成海量数据,包括 用户账号、发布时间、经纬度坐标、博文、图片、微视频、 关注热点等,这些数据中包含有地震灾情信息,如震感、人 员伤亡、房屋破坏、生命线工程破坏、地震地质灾害等。通 过对这些微博“大数据”进行充分挖掘、分析、表达和应用, 能客观地反映灾情时空演变规律,辅助地震灾情快速研判, 服务政府应急救援决策。[HJ] 本文根据微博舆情数据特点和传播特性,研究如何利 用微博舆情数据分时段提取地震有感范围,并以2014年景 谷66级地震为例进行应用检验。 1研究技术框架 当破坏性地震发生后,首先根据地震三要素信息,通 过微博API调用、关键字检索、网络爬虫、专业地理抓取等 技术手段,实时获取微博用户发布的信息,信息主要来源于 新浪、腾讯、网易、人民网等主流网站微博用户,对这些信 息进行存储管理,形成结构化的数据库。其次,对微博数据 进行解析、去重,提取有效信息,包括微博发布时间、博文 内容、图片、空间经纬度坐标等,并对核心博文内容进行中 文分词、清洗等挖掘处理,提取与地震灾情相关的特征词, 根据相关标准和规则对微博数据与地震烈度判定的描述性 信息进行关联匹配,建立微博地震灾情信息分类表。最后, 以微博灾情节点为基础进行空间插值,将离散分布的灾情点 转化为连续分布的灾情有感范描述灾情时空演变规 转化为连续分布的灾情有感范 描述灾情时空演变规 律,辅助灾情研判。具体研宄技术框架如图1所示。 2微博数据获取 微博数据获取方式有网络爬虫技术和调用微博官方 API接口两种途径,基于网络爬虫技术获取信息的基本流程 是通过设定入口 URL地址,按照一定的爬行策略将网页内 容保存,并提取网页中有效地址作为下一次爬行的入口 URL 地址,直到爬行完毕。由于地震灾情信息抽取和空间定位要 求,该方式信息获取效率不高,空间地理位置还需通过地名 规则、地址匹配技术进行解析获取,另外,多次访问有账号 屏蔽风险。因此,本文以当前用户基数较大的新浪微博为例, 注册认证后获取调用新浪微博的API权限,通过调用相关 API,解析服务器返回的JSON数据文档获取微博信息,该 方式微博信息获取时效性高,数

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档