基于Hadoop的社交媒体时空模型应用项目计划书.docx

基于Hadoop的社交媒体时空模型应用项目计划书.docx

大学生GIS软件开发竞赛 项目计划书 (C-Web应用设计组适用) 作品名称 基于Hadoop的社交媒体时空模型应用 报名单位 地理信息与旅游学院 团队成员 指导老师 电话及QQ 指导老师电话 作品概述 引言 当今时代,是一个几乎人人都离不开社交媒体的年代。根据新浪年报提供的数据,2013年上半年,每日新增微博约2亿。也就是说在1分钟内新增了约138.9万条新数据,当前这个数据量还在增加。 近年来,随着感知技术和计算环境的成熟,各种大数据在城市中悄然而生。利用城市中的大数据来解决城市本身所面临的挑战,为公众服务日益成为人们关注热点,不管是百度迁徙,还是高德的实时路况图或百度热力图,都体现了基于地理位置的大数据运算在城市计算上的应用。 其实社交媒体数据量庞大,而且具有实时更新的特点,其中包含的位置信息、时间信息甚至语义信息对于城市计算的研究和应用都具有十分重要的意义。 但是目前对于大数据的实时计算以及流数据时空语义模型的构建成为LBSN应用的难点。我们的作品,正是利用微博大数据中的位置、时间和语义等信息,基于Esri前沿技术GIS Tools for hadoop对LBSN应用的尝试。欢迎走进我们的作品——基于Hadoop的社交媒体时空模型应用。 作品主要通过抽取大量的微博数据,参考文献和情感词表,对每一条进行分词。分词过后,使用Mongo DB进行非结构化的存储与建立索引,并在

文档评论(0)

1亿VIP精品文档

相关文档