- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据分析:出版业转型升级的新助力.doc
大数据分析:出版业转型升级的新助力
摘要:大数据分析正在改变出版企业的运营方式,出版业对内容的搜集、储存与传播方式也将因大数据分析的出现而发生深刻变化,大数据分析将促进出版业深度信息化。
关键词:大数据;出版;数字出版
一、大数据分析的价值在于预测
大数据(big data),又称巨量资料,一般指的是所涉及的资料信息量巨大到无法通过目前主流软件工具在合理时间内实施抓取、管理和处理的数据集合。大数据环境下,一批世界级的互联网公司如亚马逊等在大数据应用上不断推陈出新,电商、社交网站及智能搜索、网络广告等网络服务也纷纷借助大数据分析提升应用和服务能力。
大数据分析的核心技术是数据挖掘算法,最重要的应用领域是预测性分析,从大数据中挖掘出特点并建立模型,再通过模型带入新的数据,从而预测未来的数据。近年来,大数据分析已经渗透到诸多行业,逐渐成为重要的生产因素。出版实质上是一个搜集、选择、加工、发布信息与知识供用户使用的过程,大数据的出现,对出版的各个环节都产生了重要影响。大数据分析的价值在于预测,通过海量数据的分析,提取有价值的数据关系,从而对选题分析、复制数量、销售渠道和销售行为提供帮助。大数据环境下,出版业是否转型和如何转型值得业界同仁深入思考。
二、大数据分析给出版业带来新机遇
1.出版业的大数据
大数据的构成基础是“小”数据。单个出版社的数据信息,一般可分成两类。一类包含出版社历年的经营数据即品种、出书码洋、销售码洋、销售实洋、回款、利润等,以及作者数据、读者数据、经销商数据等。这类数据一般是结构化数据,可以用数字或统一的结构加以表示。另一类数据信息是出版内容,包含以各种介质发布的数字化出版内容。这类数据是非结构化数据,无法用数字或统一的结构表示。单个出版社的数据信息量,一般在TB级别,很少能到PB级别(1TB=1024GB,1PB=1024TB)。这些数据信息可以用企业ERP管理系统和内容管理系统CMS加以管理,因而笔者称其为“小”数据。
就整个出版行业而言,除了包含行业经营数据和出版物内容数据这种结果数据外,还包含交易数据、专家推荐和读者评论信息这种过程数据。整个出版行业的数据信息量已经非常巨大,达到EB甚至ZB级别(1EB=1024PB,1ZB=1024EB)。同时,据有关机构分析,这些数据80%以上为非结构化数据,并且是快速增加的。整个出版行业的数据很难用一个或几个软件系统加以管理和分析,因而属于典型的大数据。
2.大数据分析创新出版模式
大数据分析有利于提高出版经营活动的绩效,创新出版模式,促进出版业的转型升级,加快数字出版的发展。通过数字阅读与交易平台以及内容数据库、用户信息数据库和销售信息数据库,出版机构能收集大量的用户数据,能够更方便、更精准地分析用户内容偏好和用户购买行为,从而做出产品开发与销售方面的合理预测和判断。
在传媒文化产业中,大数据分析带来新的生产机制早有先例。比如出品方兼播放平台Netflix的一部《纸牌屋》,让全世界的文化产业界都意识到了大数据的力量。据统计,2013年《纸牌屋》的数据库包含了约3000万用户的收视选择、400万条评论、300万次主题搜索。最终,拍什么、谁来拍、谁来演、怎么播,都由数千万观众的喜好统计决定,每一步都由精准的数据引导,从而获得了极高的收视率。可以说,这是部用大数据“算”出来的电视剧,实现了由用户需求决定生产。
与此相似,出版业也产生了名为“粗剪”的出版模式。粗剪是出版商提供的一种服务,这种服务让读者在图书正式出版前就可以看到书稿的内容。只要读者购买了某一本书的粗剪服务,他就可以获取编辑正在编辑加工或作者正在修改的书稿,可以通过在线阅读,或下载书稿的PDF文件,或按需打印书稿。通过对正在编撰或校对的书稿的阅读,读者可以提出对书稿的建议、评论或指出书稿中的错误。这样读者可以直接影响书稿正式出版后的内容。出版商根据读者反馈的数据,不断调整内容,从而使得正式出版的产品获得更广泛的市场认同。
出版机构利用大数据分析进行定制出版的例子还有美国Coliloquy公司。Coliloquy公司专注于亚马逊Kindle平台产品研发,该公司推出了“动态小说”,读者可以对小说人物和故事主线进行选择,编辑或作者再根据大量读者对人物或情节的选择数据调整小说的人物或情节发展,从而实现动态定制出版,定制内容主要集中在爱情小说、科幻小说等类别,被称为大数据背景下的“快销书”。
三、大数据分析急需出版信息化
大数据分析最为重要的基础是数据,最重要的作用是预测。出版企业要通过大数据实现对选题的分析、媒体形态的选择和实现精准营销,首先需要有企业自身的数据和整个行业的数据。换句话说,大数据分析要求出版企业和出版行业必须
文档评论(0)