网站大量收购独家精品文档,联系QQ:2885784924

大数据技术在出版领域的应用.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据技术在出版领域的应用 随着物联网、云计算等技术的日新月异,信息技术的发展逐渐进入了一个新阶段。规模化的数据以及对规模化数据的开发和利用, 成为数字时代发展的一个新趋势。英国著名学者维克托·迈尔·舍恩伯格在其《大数据时代》一书称这样一个时代为大数据时代。他认为, 大数据时代的到来意味着一个新的技术革命浪潮的到来。围绕大数据, 人类社会的生产和生活方式将发生新的变革。全球著名的战略思想库麦肯锡全球研究院在2011年发布的《大数据:创新、竞争和生产力的下一个前沿》报告中指出, 数据将成为未来人类社会赖以生存的新的重要的战略性生产资料, 将是未来社会创新、竞争和生产力的下一个前沿。作为数字时代发展的新趋势, 大数据技术的应用无疑将对包括出版业在内的社会方方面面产生重要的影响。那么, 大数据技术的应用将会对出版业的发展, 尤其是出版业的转型升级产生什么样的影响?这是出版界必须思考的重要问题。 一、 大数据技术的应用 从字面意义上来看, 大数据指规模化的海量数据。实际上是指大小超出了典型数据库软件的采集、储存、管理和分析能力的数据集。这样一个数据集, 数据量从TB级发展到PB级, 不仅信息量大, 且数据来源多样化、数据类型多种化, 同时这样的数据集还具有数据增长速度快和数据处理速度要求高的特征, 这就决定了大数据库的建立, 不是现有的数据库软件所能处理的, 也不是现有的信息技术基础设施所能承载的。大数据对传统信息处理有这么高的要求, 却受到人们的推崇, 根本原因在于它具有很强的商业价值, 在未来可能形成变革时代的商业模式。 一般认为, 大数据特征可用4个“V”来概括。一是Volume Big, 即数据规模容量大, 计算能力要求高, 从TB到PB, 甚而EB和ZB。如此海量的数据信息远非现有信息基础设施和IT架构所能承担。二是Variable Type, 即数据类型多样, 数据来源多种。既有结构化数据, 又有半结构化数据, 更有非结构化数据, 且将以网页、视频、图像与位置等形态的半结构化和非结构化数据为最主要的数据类型。三是Velocity Fast, 即数据处理实时速度要求快。大数据的数据流是高速实时数据流, 换言之为动态数据, 因此对数据处理速度和持续性要求非常高。四是Value High, 即商业价值高。但大数据的商业价值高和价值密度低是相伴而存的, 也就是获取的具有高度价值的信息, 是通过海量数据处理而来的, 可谓“千淘万漉真辛苦, 狂沙吹尽才到金”。 大数据技术的应用能够形成一种商业模式的奥秘在于, 大数据不仅是一种资源, 更是一种工具。作为一种工具, 利用大数据进行数据分析, 可进行趋势判断, 从而进行商业价值开发。如2009年, 在甲型H1N1流感病毒爆发之前, 美国谷歌公司的工程师在《自然》杂志发表了一篇令人瞩目的论文。在该论文中, 数据分析师分析了美国人最频繁检索的5 000万词条, 然后运用不同的数学模型, 将其与美国疾控中心2003年至2008年季节性流感传播期的数据进行了对比研究, 最后得出的预测结果与官方数据的相关性高达97%。令人感到震惊的是, 谷歌公司利用大数据分析, 不仅能够准确地预判流感的来源地, 且预判的时间要领先于疾控中心数据分析一周之早。利用数据进行分析, 从而进行产品开发无疑具有巨大的商业空间。总体来看, 大数据技术利用的商业模式, 主要是大数据分析所开发的新的产品。这些产品, 或可优化企业管理, 或可提升企业服务能力, 或可提升企业产品的价值, 甚至形成新的信息产品。 大数据技术的运用是基于海量数据的获取。数据的获取能力, 是决定大数据分析和开发的关键。大数据技术运营的过程中, 其数据主要来源是什么呢?一般认为, 这种来源主要包括3个方面。一是企业内部的经营交易信息, 二是物联网世界中商品和物流信息, 三是互联网世界中人与人交互信息和位置信息。这3大数据信息的海量集聚, 才是大数据产业化和价值化的关键。从流程来看, 大数据的运营模式应由这样一些环节构成:首先是数据获取, 其次是数据分析, 最后是数据产业化。 二、 大数据技术应用带来的挑战 大数据标志着数字时代发展的新趋势。出版业作为文化产业的核心组成部分, 正在经历着数字转型的艰难挑战, 无疑也受到大数据技术应用的深刻影响。这种影响具体到出版业本身, 主要表现在以下几个方面。 1. 大数据时代出版管理的新趋势 大数据不仅是一种工具, 更是一种哲学观和方法论。这种哲学观就是人类社会的发展已进入以数据资源为基础的阶段, 数据思维将是人类发展的一个主要思维方式。正如《大数据时代的历史机遇》一书所说:“缺少数据资源, 无以谈产业。缺少数据思维, 无以言未来。”在大数据时代, 数据成为一种与能源和物质同等重要的生产资料, 围绕数据进行产品开发和服务

文档评论(0)

lmzwkyc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档