采用基于IBMPowerSystems非结构化文本分析支持.PDF

采用基于IBMPowerSystems非结构化文本分析支持.PDF

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
采用基于IBM Power Systems 的非结构化文本分析支持 关键决策商业案例 Stephen Markham 博士 Michael Kowolenko 博士 北卡罗莱纳州立大学 管理学院 这是一个问题,不是技术。 --Michael Kowolenko 虽然大数据能够极大地改变业务环境,但技术只是决定的推动因素。很多公司利用结构化 大数据制定日常运营决策。然而,非程序化的关键战略决策往往涉及非结构化数据。本文 介绍使用大数据技术收集和分析非结构化数据的商业价值。这种方法采用融入流程中的重 要思考,结合先进的服务器和软件将大数据转化为商业价值。这种流程和结果为需要自适 应结构、文化和专业技术,实现大数据应有能力带来了新机遇。 本文包括三个目的。首先,说明采用结构化和非结构化数据制定决策的差别。然后,举 例说明企业如何利用非结构化数据实现商业价值。最后,说明企业如何利用非结构化数 据实现类似商业价值,以及为什么选择正确的服务器和软件可以产生不同的结果。 基于Power System 进行非结构化数据分析 1. 采用结构化数据与非结构化数据制定决策的差别 非结构化文本包括现有大约80%的数据。只使用结构化数据的企业失去大量可用信息 产生的收益。非结构化数据包括美国证券交易委员会(SEC) 、国家卫生研究院(NIH) 、 国家科学基金会(NSF) 和能源部(DOE) 等政府报告,以及学术研究、商业和金融分析 报告,咨询调查结果和许多其他来源所含的内容。非结构化文本还存在于无数社会媒体 渠道中,如Facebook、博客、顾客投诉记录和Twitter,以及新闻报道、大众媒体、专 业杂志和许多其他网站。 非结构化数据揭示客户需求、竞争对手的动作、新趋势,以及制定关键业务决策所需的其 他信息。结构化大数据方法收集合并行列数字提供给决策者。采用先进的统计技术分析大 量数字,可以揭示数据中的重要模式。利用这些技术,决策者可以实时了解发生的情况, 或将要发生的情况。分析可以进行加、减、乘、除的数据依赖于结构化方法收集数据,对 于定价、分销和库存等业务决策是必不可少的。 另一方面,非结构化办法解析重要信息。例如,非结构化大数据发现一家竞争对手将建新 厂的公告,或者一家客户将扩展运营的公告。从而使决策者能够快速做出反应– 在结构化 数据最终显示销售收入下降之前。要想真正做到 “大海捞针”,企业必须采用大数据收集 大量非结构化文本,利用专用程序通过计算机搜索,在数以千万计的文档中找出特定信 息。 1.1. 重点思考推动大数据的使用 基于数据制定决策需要人们知道提出的问题,但经验表明,情况并非总是如此。许多组 织缺少采用重点思考的流程。在创新管理研究中心(CIMS) 1 进行的每个行业赞助项目 中,从初创企业到《财富500强》成员,各类公司都面临开展战略调查的困扰。 1 CIMS 由工业大学合作研究中心(IUCRC) 设立,成立于1984年,是唯一由美国国家科学基金会(NSF) 提供 资金支持的研究中心,主要调查创新在组织和管理方面产生的成果。 2 基于Power System 进行非结构化数据分析 重点思考肯定推动大数据的使用– 大数据不能推动思考。重点思考是寻找数据源和工具, 了解非结构化文本潜在含义的基础。例如,“我们公司需要调查社交媒体进行情感分析” 这句话,可以分解成一系列小问题,例如: o 与我们产品相关的情感 o 与竞争相关的情感 o 客户喜欢和不喜欢产品之类的问题 o 我们公司的新产品如何解决客户不喜欢 o 提高哪方面的竞争力可以解决客户不喜欢 根据重点思考原理,我们帮助开发了利用非结构化文本实现商业价值的流程。实际上, 大量公司利用重点思考成功开发了业务决策流程。 1.2. 利用重点思考分析非结构化数据的过程 这个过程( 图1) 需要相关各方跨部门团队从一开始就共同参与,并已在许多行业证明是成 功的。这个过程采用重点思考的方法:1) 定义提问内容,组成需要调查的具体问题; 2) 确 定信息源; 3) 确定搜索条件,并定义条件之间的关

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档