浅析基于商业智能的新闻采编业务流程数据分析挖掘.docVIP

浅析基于商业智能的新闻采编业务流程数据分析挖掘.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析基于商业智能的新闻采编业务流程 数据分析挖掘 引言 在大数据时代,数据的价值越来越受到各行业的重视。企业内积累 的大量业务流程数据迫切需要人们从中“淘金商业智能是能满足企业 这一迫切需求的有力工具,能将海量数据转化为知识,有助于从以往数 据中发现业务趋势,为企业决策层提供辅助决策。Gartner调查显示, 2012年和2013年,BI已上升到全球CIO优先考虑的十大技术的首 位。 当今传统媒体转型面临严峻形势,而大数据将是媒体转型的有力武 器。在新媒体时代,用户需要及时、准确、个性化的新闻服务。数据挖 掘可以帮助传统媒体充分发挥人才资源优势,提升品牌竞争力和用户黏 性。在新闻采编业务中,存在大量流程数据,在以往的采编系统中这些 数据并未受到重视,而借助商业智能的相关技术对这些业务流程数据进 行分析挖掘,有助于提高采编全流程业务管理信息化水平,掌握报道进 展情况、人员工作效率、稿件落地情况和传播效果等。 1.商业智能的定义 商业智能又名商务智能(Business Intelligence, Bl)。商业智能 对数据进行收集、管理,提供一系列技术和方法对企业的各类数据进行 分析。商业智能可以帮助企业的领导层从宏观上掌握企业的运转情况, 洞察潜在行业的机会,辅助他们进行决策。 2 ?研究商业智能的意义 商业智能帮助企业迅速发现问题,提示企业管理者加以解决。具体 到新闻采编行业来说,商业智能贴近媒体管理者的迫切诉求。通过对新 闻传播影响力的分析挖掘,使管理者可以清楚掌握新闻的传播效果和影 响力。 商业智能为新闻创造价值,帮助传统媒体实现以“终端用户为中心” 的转型升级,通过对用户行为的分析挖掘,可以对用户群体按照性别、 年龄、职业、地域等因素进行分类或聚类,把用户进行群体细分,针对 不同用户推荐感兴趣的新闻内容,使媒体更懂用户。 帮助在新闻生产的每个环节控制成本,通过新闻生产力的分析挖 掘,展示各采编部门和人员的生产效率,为采编人员和部门考核提供依 据。运用商业智能的方法,可以提高决策的水平,对业务流程进行改进, 最终提高管理的效率。 及时性是新闻的基础,通过对互联网海量数据的挖掘可以发现潜在 的新闻热点。比如:网络媒体和新媒体中大量用户的阅读和评论数据可 以辅助采编人员发现新闻热点。 商业智能关键技术 3.1 OLAP 即联机分析,提供多维数据管理环境,使企业的数据分析人员能从 多个维度对商业问题进行建模和分析。 3.2数据分析 使用适当的统计分析方法对数据进行分析,提取出有价值的信息。 3.3数据挖掘 数据挖掘就是从大量数据中挖掘出隐含的、未知的、有价值的关联 和模式,建立可用于决策的模型,提供分析风险、进行预测的功能。 商业智能体系结构 首先将分散在企业各系统中的数据,包括关系型数据也包括非关系 型数据进行汇总,通过数据抽取(Extract)、转换(Transform)、清 洗(Cleaning)、装载(Load),最终按照预先定义好的数据模型, 将数据加载到数据仓库中,这一过程简称ETL。 通过对企业数据需求的分析,建立企业数据仓库的逻辑模型和物理 模型,将企业各类数据按照分析主题进行组织和归类。 在数据仓库的基础上提供多种软件工具供终端用戸查询和生成报 告,包括OLAP工具、数据挖掘软件、报表工具等。 在新闻业务中的应用 5.1数据源 数据仓库中数据的采集需要从各种业务应用系统和管理信息系统 中获取,如稿件建采系统、编辑系统、供稿系统、0A系统等,按照统 一的数据标准存放在数据仓库中。 本文将采编业务系统数据划分为静态信息数据、动态信息数据两大 类。 静态信息数据是指相对稳定的信息,主要指采编部门、采编人员、 发稿线路等静态属性信息数据。 动态信息数据收集在采编业务系统中不断变化的流程数据,包括 采、编、签、改、发、供、馈等环节。如何对新闻业务数据,特别是用 户行为数据构建数据模型,分析稿件流转过程,将是本文着重介绍的内 容。 5.2分析目标 通过釆集稿件、流程、人员和质量数据,进行采编业务全流程的管 理,掌握报道进展情况、人员工作效率、稿件落地情况、传播影响效果 等。从全流程状态、传播影响力、新闻生产力等主题进行数据分析挖掘, 呈现新闻生产业务运行状况。 新闻生产力分析:分析呈现采编部门、采编人员等在一段时间内的 工作效率。 传播影响力:分析呈现稿件的落地情况和传播影响效果。全流程状 态分析:分析稿件在各采编环节的流转情况。 5.3数据建模 数据建模主要用到的是维度模型。一个度量往往和多个维度相关, 维度模型表达了数据之间的关联关系。比如:想要了解2016年1月 份在新媒体线路的中文稿件发稿情况,这个发稿量数据与线路、时间、 语种三个维度相关。维度建模是从多个角度和层次反映数据之间的联 系,从多个维度对数据进行重组,为

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档