研究生第六章数据仓库与数据挖掘的决策支持.pptVIP

  • 6
  • 0
  • 约1.79万字
  • 约 100页
  • 2018-10-03 发布于湖北
  • 举报

研究生第六章数据仓库与数据挖掘的决策支持.ppt

万豪酒店数据挖掘举例 公司介绍:万豪酒店国际俱乐部是美国最大的假日公寓销售商。 开始挖掘信息:机动车记录、财产记录、担保卡和通过web和邮件订购服务的顾客列表。 增加的记录:顾客年龄、子女年龄、估计收入、开何种类型的车、是否打高尔夫球等。 结果:直营促销反应率上升了33%,公司在邮件的寄送成本上花费大大降低,同样的方法也应用于互联网广告。 文本挖掘 文本挖掘是应用数据挖掘于非结构化的或者结构化程度低的文本。数据挖掘利用数据的基本结构以抽取更多的文本。 例:通过对顾客数据库的挖掘,一个分析师也许能够发现每个购买A商品的人同时6个月后也购买了B商品。 文本挖掘的作用: 发现“隐藏”的文档内容,包括有用的关系。 将不同部门的文档关联起来。例如,发现两个不同的产品部门的顾客有着相同的特征。 有着共同主题的文档。例如,所有的保险部门的顾客有着相同的投诉内容。 如何进行文本挖掘 抽取是文本挖掘的最基本形式。 将信息从非结构化的数据中抽取出来,转化为结构化的形式。 去掉那些经常使用的词。(比如:the, and,other) 用最简单的基本词代替衍生词(消除复数,消除词形变化),因此如phoned, phoning,phones。都用一个词“phone”取代。 计算词语的权重。计算单词出现的频率。 两种测量方法: 频率用于测量单词在某一个文档中出现的次数 反向频率用于测量单词在所有的一组文档中出

文档评论(0)

1亿VIP精品文档

相关文档