- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
新闻生产环节中的大数据技术运用.doc
PAGE
PAGE 6
新闻生产环节中的大数据技术运用
如今我们现在已经进入大数据时代。一般认为,大数据具有四个“V”的特点,即多样化(Variety)、大量化(Volume)、快速化(Velocity)和价值化(Value)。总体来说,大数据是以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务或深刻的洞见的数据及处理方式。
新的环境,对大型数据的挖掘、处理、分析、分享等能力提出了全新的要求,此外,大数据时代也意味着不同行业、不同领域的数据之间的交换和相互利用也变得十分频繁。大数据时代,强调的足对大规模数据的综合处理能力。
人数据的核心不是技术,而是数据产生的价值。新闻生产领域要利用大数据,关键是要从大数据中挖掘出新闻价值,利用数据挖掘技术,对海量数据进行分析,获得具有新闻价值的信息产品。对人数据的利用最主要的技术手段是数据挖掘。数据挖掘又称数据库中的知识发现,是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
面向未来,利用大数据写作预警性或趋势性新闻
以往的新闻更多地强调“已经发生的事实”,但Web2.0对传统的新闻模式形成了强有力的冲击,强调的是“正在发生的事实”。在大数据时代,通过数据挖掘对相关关系的计算,媒体可以做到对未来趋势的预测,新闻的定义可以改写为“正要发生或正在发生或已经发生的事实”的报道。
大数据的核心就是预测。它把数学算法运用到海量的数据上来预测事情发生的可能性。在大数据的背景下,通过相关关系,我们可以比以前更容易、更快捷、更清楚地分析事物。对大数据进行相关关系分析,也许不能准确解释某件事情为何会发生,但是它会提醒这件事情正在发生或即将发生。对于专业的信息传播组织媒体来说,这样的提醒已经很有帮助了。
例如,“谷歌流感趋势”是谷歌推出的一款用于预警流感的即时网络服务。该系统根据对流感相关关键词搜索进行数据挖掘和分析,目前可预测全球超过25个国家的流感趋势。谷歌保存了多年来所有的搜索记录,而且每天???会收到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。通过对特定检索词的使用频率与流感在时间和空间上的传播之间的联系的分析,谷歌也能和疾控中心一样判断出流感是从哪里传播出来的,而且非常及时。
如果媒体能广泛借助人数据技术来进行重大趋势的预测与分析,那么,它的预测的准确程度可能得到有效提升,它对社会的影响力就能得到提升。但足,需要注意的是,相关关系是无法预知未来的,大数据只能预测可能发生的事情。
除了相关性分析,物联网也可以帮助新闻从业者预测新闻。物联网也是大数据来源之一。作为物物相连的网络,物联网技术意味着,在未来,只要需要,任何物体的状态数据可以由它们们自身所携带的装置向互联网传送,这些数据也将成为未来新闻报道的重要来源――尢论是从新闻线索的提供还是新闻要素的揭示角度来看。与记者的个人观察得出的判断相比,这些直接采集的来自物体本身的数据,更为精确。从这个角度来说,物联网技术也为大数据预测新闻提供了一种途径。
面向现在,利用大数据寻找“看不见”的独家新闻
除了关联法则和相关性计算颅测新闻,大数据还可以通过聚类分析和分类分析解读新闻。这是说,对于正在或刚发生的、读者关注的重大新闻事件,媒体通过用数据挖掘得出的不同视角,可以丰富读者对事件的认知。
首先,媒体可以根据社交网站上的数据计算结果,解读受众对事件的认知和态度
大数据由于数据量庞大,采用所有数据的全样本,而不是随机抽样样本,这样我们就能够从不同的角度,更细致地观察和研究数据的方方面面。
央视曾经做过的“你幸福吗”报道遭到争议。央视记者的采访方式为大街上找人采访,这种寻找采访对象的抽样方式很不科学,所以遭人指责。通过随机抽样方法,可以用样本来估算总体,但这种方法的成功依赖于采样的绝对随机性。大数据提供的是全样本,可以保证在社交网站上的所有用户的情感计算的科学性。所以,大数据通过对社交网站上的文本信息的数据挖掘,可以了解到社交网站上的用户对重大新闻事件的情绪和态度。即大数据技术有可能使受众反馈直接转化为民意,这将使媒体在反映与传达民意方面的功能进一步增强。
例如,英国《卫报》解读2011年骚乱的事件,除了采用常规的社会科学研究方法,如采访调查外,还请了曼彻斯特大学的专业人士对250多万条与骚乱有关的Twitter信息进行大数据的分析,在此基础上做成了《暴徒的告白》。这个信息量是非常大的,包括抓取微博的信息,网络上的信息,如果没有大数据的分析方法,是不可能实现的。运用大数据生产的新闻往往给用户提供耳目一新的新闻感官和认识世界的图景。
其次,媒体可以对重要文本进行数据挖掘
文档评论(0)