- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
舆情服务领域如何运用大数据挖掘技术
摘 要:世纪之初,舆情服务行业在国内兴起。十数年时间里,舆情服务从数据监测服务阶段,发展到风险预测服务阶段,“数据”的核心地位日益凸显,快速有效地挖掘出“数据”的价值也成为舆情服务人员的必备技能。随着信息通讯技术的发展,“数据”量几何式爆炸增长,大数据时代来临。这给舆情服务工作带来新的挑战,诸多基于“大数据”应用的课题亟待研究。本文即以“大数据时代”为背景,着重阐述舆情服务领域如何运用大数据挖掘技术。
关键词:舆情;网络舆情;大数据;数据挖掘;精准价值
中图分类号:TP311.13 文献标识码:A 文章编号:1671-2064(2017)01-0050-02
世纪之初,舆情服务行业在国内兴起。十数年时间里,舆情服务从数据监测服务阶段,发展到风险预测服务阶段,“数据”的核心地位日益凸显,快速有效地挖掘出“数据”的价值也成为舆情服务人员的必备技能。随着信息通讯技术的发展,“数据”量几何式爆炸增长,大数据时代来临。这给舆情服务工作带来新的挑战,诸多基于“大数据”应用的课题亟待研究。本文即以“大数据时代”为背景,着重阐述舆情服务领域如何运用大数据挖掘技术,以飨大方。
1 认识舆情“数据”
1.1 “舆情”再定义
中正舆情机构认为,“舆情”是生产关系与生产力相互作用过程中产生的社会意见的总和。也即是说,“舆情”是一种信息集合体(社会意见),它包含态度、意见、情绪等多元的符号。根据传播信息的?d体的不同,“舆情”可分为传统舆情与网络舆情。本文主要针对网络舆情进行研究,这也是目前舆情服务行业主要关注的领域[1]。
1.2 舆情的“数据”特点
大数据时代,舆情服务作为基础应用,其使用的“数据”具有四大特点。第一,高容量(Volume),即数据巨大,从TB级别跃升到PB级别;第二,多类型(Variety),即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;第三,高速度变量(Velocity),即增长、处理速度快;第四,准确性(Veracity),即追求高质量的数据,只有真实而准确的数据才能让对数据的管控和治理真正有意义。舆情的这4个“数据”特点,既为我们展示了舆情所蕴藏的宝贵财富,也为我们设置了通向财富的“路障”。舆情服务人员需要排除噪声和干扰,对庞大、无序(非结构化)且多变的“数据”进行科学的采集、过滤和分析,这对我们建立科学的“数据挖掘模型”提出了更高的要求。
1.3 舆情“数据”的价值
当前,舆情“数据”已成为机构决策最为重要的参考依据。舆情“数据”的价值并不在于数据本身,而是在于通过分析数据的关联性来指导决策及预测未来。譬如在电商行业,电商平台不仅记录消费者的日常交易信息,还记录消费者每一次探索浏览的过程,经过数据分析处理,可以适时地推送给用户最想要的商品,或者给商家提供各式各样的“情报”、销售建议。从价值的角度来说,舆情管理的核心同样在于“分析过去和当下,预测未来”。
2 让“数据”说话
舆情“数据”要体现其价值,关键是要“让数据说话”。这包含四个重要步骤:数据采集、数据处理、数据分析、数据决策[2]。当前,针对舆情事件的处置工作,皆应遵循闭环式的处理模式,即从采集数据开始,进行分析、研判、应对等步骤,最终这一系列行为也会成为会说话的、新的决策数据如图1所示。
2.1 舆情工作基础:采集并处理数据
因舆情“数据”的4V特点,采集到的“数据”数量庞大、内容繁杂,如果这些采集到的数据不经过初步处理,那么进行后续的舆情分析工作将会十分不便。因此,我们需要对基础数据进行过滤、筛选、整理归类并“去噪”,将这些复杂的非结构化数据转换为便于处理的较为单一结构的数据,同时保证数据的有效性和可靠度。
2.2 舆情工作价值体现:让数据说话
“数据”自身是不会说话的,我们需要对已经处理成结构化的数据进行分析和解读,挖掘其中蕴含的隐性信息,从而帮助政府机构、企业机构进行决策,比如政策制定、危机处置、市场拓展、新市场发现、竞争威胁应对等。机构决策依赖于数据,这要求我们的数据必须“精准”,包括数据采集的精准和数据分析的精准。中正舆情机构认为,在数据大爆炸的今天,以现有的科学技术仅靠软件系统来实现准确的数据采集和分析是不可能的。同时,针对采集到的海量的舆情数据,计算机思维目前也不可能像真正的专家一样,根据每位用户的实际情况来做出精准的定制化分析,故而还需要组建专业的舆情分析团队,“人机并行”分析标签数据,才能有助于机构的数据决策。
3 如何做到“精准”
“及时、有效”,这是体现数据“精准”性的两项重要指标。要做到这两点,就必须建立起一套科学的数据采集、处理与分析模型,
原创力文档


文档评论(0)