- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 数据挖掘原语、语言和系统结构 数据挖掘:概念与技术 知识 .ppt
第4章 数据挖掘原语、语言和系统结构;4.1.1 为什么要数据挖掘原语和语言?;4.1.1 任务相关的数据;任务相关的数据——例子;4.1.2 要挖掘的知识类型;概念分层 ——上卷和下钻;;概念分层的类型;集合分组分层:将给定属性或维的值组织成常量或区间值。组之间可以定义全序或偏序。通常用于定义对象联系的小集合。
E.g.:
{young,middle_aged,senior} ?all(age)
{20...39} ? young,
{40...59} ? middle_aged,
{60...89} ? senior;操作导出的分层:根据用户、专家或数据挖掘系统说明的操作分层。操作可能包括信息编码串的解码,由复杂数据对象提取信息和数据聚类。
网址:
;基于规则的分层:指整个概念分层或它的一部分由一组规则定义,并根据当前数据库数据和规则定义动态地计算。
low_profit_margin (X) = price(X, P1) and cost (X, P2) and (P1 - P2) $50
high_profit_margin (X) = price(X, P1) and cost (X, P2) and (P1 - P2) $250;4.1.4 兴趣度度量;1. 简单性和确定性;2. 实用性和新颖性;4.1.5 发现模式的表示和可视化;例如:;;4.2 一种数据挖掘查询语言DMQL;数据挖掘原语的组成部分;说明数据挖掘任务的原语;部分语法:
DMQL::=DMQL_statement; { DMQL_Statement}
DMQL_Statement::=Data_Mining_Statement
| Concept_Hierarchy_Definition_Statement
| Visualization_and_Persentation
Data_Mining_Statement::=
use database database_name
| use data_warehouse data_warehouse_name
{ use hierarchy hierarchy_name for attribute_or_dimension }
…
;任务相关数据说明子句:;任务相关数据说明——示例;4.2.2 指定挖掘知识类型;1. 指定挖掘知识类型——特征化;2. 指定挖掘知识类型——数据区分;3. 指定挖掘知识类型——关联;4. 指定挖掘知识类型——分类;4.2.3 概念分层说明的语法;定义模式分层
模式分层类型的概念分层的定义,假设全序为:streetcityprovincecountry,相应的DMQL语法定义如下所示:
Define hierarchy location_hierarchy on location as [street, city, province, country];all;4.2.4 兴趣度度量说???的语法;4.2.5 模式表示和可视化说明的语法;4.2.6 一个DMQL查询的完整示例;;4.2.7 其他数据挖掘语言和数据挖掘原语的标准化;4.3 基于数据挖掘语言的图形用户界面设计;4.4 数据挖掘系统的体系结构;DM与DB/DW的耦合方式 ;半紧密耦合
除了将DM系统连接到一个DB/DW系统之外,一些基本数据挖掘原语(通过分析频繁遇到的数据挖掘功能确定)可以在DB/DW系统中实现。
一些中间的挖掘结果可以在DB/DW上实现计算或有效的即时计算,性能会有较大提高。
紧密耦合
DM系统平滑地集成到DB/DW系统中。数据挖掘子系统被视为信息挖掘子系统的一部分,数据挖掘查询和功能根据DB或DW系统的挖掘查询分析、数据结构、索引模式和查询处理方法优化。
提供了一个统一的信息处理平台,功能、性能等方面都会达到一个高水平。
您可能关注的文档
- 第3讲 沟通策略(简历与求职信写作) 讲义 相关管理沟通 课件 ppt.ppt
- 第3讲 生命周期法-结构化系统分析 信息系统分析与 及设计.ppt
- 第3讲 网格诊断 MOLDFLOW注塑流动分析案例教材.ppt
- 第3讲 翻译中的句式衔接与 及布局 汉英翻译 .ppt
- 第3讲 草图草图编辑与 及操作 Cimatron E10中文版三维造型与 及数控编程入门教程课件.ppt
- 第3讲 马克思的幽灵 西方文论 演示教学.ppt
- 第3讲+研究设计_2012_ 社会研究方法A 知识讲稿.pptx
- 第3讲2 相互作用系数 辐射剂量与 及防护课件.ppt
- 第3讲 VHDL结构与 及要素 EDA课件.ppt
- 第3讲增值税进项税额及其转出的会计处理 税务会计与 及纳税筹划课件.ppt
文档评论(0)