从数据中发现信-数据挖掘技术浅介.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从数据中发现信-数据挖掘技术浅介

从 数 据 中 发 现 信 息 —— 数 据 挖 掘 技 术 浅 介 张 光 业 ---- 随 着 数 据 量 的 急 剧 增 长, 现 在 的 用 户 很 难 再 像 从 前 那 样, 自 己 根 据 数 据 的 分 布 找 出 规 律, 并 根 据 此 规 律 进 行 分 析 决 策。 因 此 必 须 借 助 于 相 应 的 数 据 挖 掘 工 具, 自 动 发 现 数 据 中 隐 藏 的 规 律 或 模 式, 为 决 策 提 供 支 持。 数 据 挖 掘 技 术 主 要 用 于 从 大 量 的 数 据 中 发 现 隐 藏 于 其 后 的 规 律 或 数 据 间 的 关 系, 它 通 常 采 用 机 器 自 动 识 别 的 方 式, 不 需 要 更 多 的 人 工 干 预。 数 据 挖 掘 技 术 是 数 据 仓 库 技 术 中 一 个 重 要 的 应 用 程 序, 具 有 相 对 独 立 特 性。 采 用 数 据 挖 掘 技 术, 可 以 为 用 户 的 决 策 分 析 提 供 智 能 的、 自 动 化 的 辅 助 手 段, 在 零 售 业、 金 融 保 险 业、 医 疗 行 业 等 多 个 领 域 都 可 以 有 很 好 的 应 用。 ---- 目 前, 数 据 挖 掘 应 用 市 场 正 在 逐 渐 形 成, 应 用 前 景 十 分 广 阔。 很 多 厂 商 如IBM、 SGI、 Neovista 等 都 对 数 据 挖 掘 技 术 投 入 了 大 量 的 精 力, 提 供 了 一 些 商 业 化 的 数 据 挖 掘 工 具, 并 已 应 用 到 多 个 数 据 仓 库 系 统 中。 数 据 挖 掘 应 用 分 类 ---- 根 据 数 据 挖 掘 的 应 用 类 型 不 同, 大 致 可 分 为 以 下 几 类: ---- 1 . 分 类 模 型 ---- 分 类(Classification) 模 型 的 主 要 功 能 是 根 据 商 业 数 据 的 属 性 将 数 据 分 派 到 不 同 的 组 中。 在 实 际 应 用 过 程 中, 分 类 模 型 可 以 分 析 分 组 中 数 据 的 各 种 属 性, 并 找 出 数 据 的 属 性 模 型, 确 定 哪 些 数 据 模 型 属 于 哪 些 组。 这 样 我 们 就 可 以 利 用 该 模 型 来 分 析 已 有 数 据, 并 预 测 新 数 据 将 属 于 哪 一 个 组。 ---- 分 类 模 型 应 用 的 实 例 很 多, 例 如, 我 们 可 以 将 银 行 网 点 分 为 好、 一 般 和 较 差3 种 类 型, 并 以 此 分 析 这3 种 类 型 银 行 网 点 的 各 种 属 性, 特 别 是 位 置、 盈 利 情 况 等 属 性, 找 出 决 定 它 们 分 类 的 关 键 属 性 及 相 互 间 关 系, 此 后 就 可 以 根 据 这 些 关 键 属 性 对 每 一 个 预 期 的 银 行 网 点 进 行 分 析, 以 便 决 定 预 期 银 行 网 点 属 于 哪 一 种 类 型。 ---- 2 . 关 联 模 型 ---- 关 联(Association) 模 型 主 要 是 描 述 了 一 组 数 据 项 目 的 密 切 度 或 关 系。 关 系 或 规 则 总 是 用 一 些 最 小 置 信 度 级 别 来 描 述 的。 置 信 度 级 别 度 量 了 关 联 规 则 的 强 度。 关 联 模 型 的 一 个 典 型 例 子 是 市 场 菜 篮 分 析 (Marketing Basket Analysis), 通 过 挖 掘 数 据 派 生 关 联 规 则, 利 用 此 规 则 可 以 了 解 客 户 的 行 为。 采 用 关 联 模 型 比 较 典 型 的 案 例 是“ 尿 布 与 啤 酒” 的 故 事。 在 美 国, 一 些 年 轻 的 父 亲 下 班 后 经 常 要 到 超 市 去 买 婴 儿 尿 布, 超 市 也 因 此 发 现 了 一 个 规 律, 在 购 买 婴 儿 尿 布 的 年 轻 父 亲 们 中, 有30% ~40% 的 人 同 时 要 买 一 些 啤 酒。 超 市 随 后 调 整 了 货 架 的 摆 放, 把 尿 布 和 啤 酒 放 在 一 起, 明 显 增 加 了 销 售 额。 同 样 的, 我 们 还 可 以 根 据 关 联 规 则 在 商 品 销 售 方 面 做 各 种 促 销 活 动。 ---- 3. 顺 序 模 型 ---- 顺 序(Sequence) 模 型 主 要 用 于 分 析 数 据 仓 库 中 的 某 类 同 时 间 相 关 的 数 据, 并 发 现 某

文档评论(0)

xll805 + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档