研究生第六章数据仓库与数据挖掘的决策支持资料.ppt

研究生第六章数据仓库与数据挖掘的决策支持资料.ppt

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
万豪酒店数据挖掘举例 公司介绍:万豪酒店国际俱乐部是美国最大的假日公寓销售商。 开始挖掘信息:机动车记录、财产记录、担保卡和通过web和邮件订购服务的顾客列表。 增加的记录:顾客年龄、子女年龄、估计收入、开何种类型的车、是否打高尔夫球等。 结果:直营促销反应率上升了33%,公司在邮件的寄送成本上花费大大降低,同样的方法也应用于互联网广告。 文本挖掘 文本挖掘是应用数据挖掘于非结构化的或者结构化程度低的文本。数据挖掘利用数据的基本结构以抽取更多的文本。 例:通过对顾客数据库的挖掘,一个分析师也许能够发现每个购买A商品的人同时6个月后也购买了B商品。 文本挖掘的作用: 发现“隐藏”的文档内容,包括有用的关系。 将不同部门的文档关联起来。例如,发现两个不同的产品部门的顾客有着相同的特征。 有着共同主题的文档。例如,所有的保险部门的顾客有着相同的投诉内容。 如何进行文本挖掘 抽取是文本挖掘的最基本形式。 将信息从非结构化的数据中抽取出来,转化为结构化的形式。 去掉那些经常使用的词。(比如:the, and,other) 用最简单的基本词代替衍生词(消除复数,消除词形变化),因此如phoned, phoning,phones。都用一个词“phone”取代。 计算词语的权重。计算单词出现的频率。 两种测量方法: 频率用于测量单词在某一个文档中出现的次数 反向频率用于测量单词在所有的一组文档中出现的次数。 文本挖掘的应用例子 营销:预测哪些顾客会对互联网旗条广告回应或者购买特定产品。 银行业:预测坏账的水平和针对信用卡的欺诈行为。 零售和销售:销售预测和决定正确的库存水平和货架布置。 制造和生产:预测何时会发生机器故障,寻找控制生产能力优化的关键因素。 医疗:将病人的人口统计数据和关键的病症联系起来,医生应用数据挖掘可以对症状有更深的理解并提供合理的医疗。 6.6.4 数据挖掘的决策支持应用领域 1、金融 (1)“数据清理”、金融市场分析和预测 (2)帐户分类、银行担保和信用评估。 2、医疗保健 任务是进行数据清理,预测医疗保健费用。 3、市场业 进行市场定位和消费者分析,辅助制定市场策略。 6.6.4 数据挖掘的决策支持应用领域 4、零售业 目前主要应用于销售预测、库存需求、零售点选择和价格分析。 5、制造业 进行零部件故障诊断、资源优化、生产过程分析等。 6、司法 应用在案件调查、诈骗监测、洗钱认证、犯罪组织分析等工作。 * 1.由于数据库技术的发展,各企业积累并存放了大量业务数据,而它为企业提供辅助决策信息太少,需要改变目前现状。 2. 由于市场竞争激烈,新产品周期缩短,如何综合利用分散的异构环境数据源,及时得到准确的信息是使企业取得成功的关键。 例: 在电话公司中,用于呼叫的数据是典型的最密集数据;在银行中,与账目核对和自动柜员机有关的数据是典型的最密集数据。对于零售业而言,销售和库存数据是最密集的数据等等。 * * 案例分析 通过吉林市等城市的成功试点,中国移动已经决定将数据集市作为2006年移动地市级公司的建设重点之一。这也同时意味着,电信行业建立在数据仓库基础上的BI应用已经进入到更加深入挖掘的阶段,其产生的结果将直接服务于一线的生产销售…… 数据集市:深化挖掘第一步 电信行业对于数据仓库并不陌生,为了实现从产品导向往客户导向的转变,电信公司纷纷建立以客户为中心的数据仓库,希望依据客户的需要、期望及喜好来制订策略,提升企业竞争力。简单说,数据仓库就是为了保证数据查询和分析的效率,按照主题将所有的数据分门别类进行存储,需要的时候,可以按主题提取数据并做进一步的分析处理。 数据集市,可以称作小数据仓库,是用来分析相关专门业务问题或功能目标而做的专项的数据集合。它建立在具有统一数据存储模型的数据仓库下,各级业务人员按照各部门特定的需求把数据进行复制、处理、加工,并最终统一展现为有部门特点的数据集合,数据集市的应用是对数据仓库应用的补充。 经过近几年的努力,吉林移动通信有限责任公司已经成功在省级公司建立起了面向决策支持的经营分析系统,BI系统也逐渐完善。省级公司从业务系统中将相关业务数据进行抽取、清洗、加工、整理、加载到数据仓库中,在数据仓库中形成基础的分析数据的存储,对地市一级公司的营销策略进行指导。 问题也随之产生,由于下属分公司在客户群体、市场容量、利润来源等地域差异明显,省级公司通过全省范围内分公司数据的汇总和分析,难以对单个地市级分公司产生个性化决策支持。另一方面,地市一级的分公司在开拓终端市场的过程中,激发了旺盛的应用需求,具体表现为对数据粒度的要求更加精细、需求更加灵活多变、要求更强的可操作性。 2005年6月,中国移动通信有限公司制定了《中国移动经营分析系统数据集市(试点)业务

文档评论(0)

三哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档