- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概念分层说明的语法——集合分组分层概念分层中的概念数字混合分层的DMQL表示说明语法 all young middle_aged senior 20…39 40…59 60…89 Level 0 Level 1 Level2 define hierarchy age_hierarchy for age on customer as level1: {young, middle_aged, senior} level0: all level2: {20…39} level1: young level2: {40…59} level1: middle_aged level2: {60…89} level1: senior 其中,“”小于号,表示从属。 4、兴趣度度量说明的语法 兴趣度的度量包括置信度、支持度、噪声(空缺值、错误值比例)和新颖度(新颖度可以将挖掘的模式与预期模式对比,偏差越大则说明新颖度越高)等度量,可以通过将模式的兴趣度度量与相应的临界值(用户自定义)相比较决定一个模式是否为感兴趣的模式。with interest_measure_name ?threshold = threshold_value 示例:挖掘关联规则时限定找到的感兴趣模式必须满足最小支持度为5%,最小置信度为70% with support threshold = 5% with confidence threshold = 70% 5、模式表示和可视化说明的语法 对挖掘出来的模式,可以使用多种形式进行表示,包括:规则(rules)、表(table)、饼图(pie chart)、立方体(cube)、曲线(curve)等。 display as result form 为了方便用户在不同的角度或者不同的概念层观察发现的模式,用户可以使用上卷、下钻、添加或丢弃属性或维等操作进一步概化数据。形式: Multilevel_Manipulation?::= roll up on attribute_or_dimension | drill down on attribute_or_dimension | add attribute_or_dimension | drop attribute_or_dimension 例:假定描述是基于维location, age和income的挖掘。用户可以”roll up on location”(执行此操作,在location维用高层概念代替低层概念), “drop age”, 概化发现的模式。 举例:一个DMQL查询的完整示例 数据挖掘任务:查询AllElectronics购买商品的价格不小于$100的,用AmEx信用卡结帐的加拿大顾客的购买习惯特征(年龄,商品类型和产地),以表的形式表示挖掘的模式 use database AllElectronics_db (1、说明感兴趣的数据集,限定数据库) use hierarchy location_hierarchy for B.address (3、此处背景知识就是概念分层) mine characteristics as customerPurchasing (2、指定挖掘的数据类型、知识类型:此处是挖掘特征化) analyze count% in relevance to C.age, I.type, I.place_made (1、说明感兴趣的数据集,限定跟表相关的属性名) from customer C, item I, purchases P, items_sold S, works_at W, branch (1、说明感兴趣的数据集,限定使用到的表的名字) where I.item_ID = S.item_ID and S.trans_ID = P.trans_ID and P.cust_ID = C.cust_ID and P.method_paid = ``AmEx and P.empl_ID = W.empl_ID and W.branch_ID = B.branch_ID and B.address = ``Canada and I.price = 100 (2、指定挖掘知识类型、此处是特征化) with noise threshold = 0.05 (4、说明兴趣度度量) display as table (5、模式表示和可视化说明) 其他数据挖掘语言和数据挖掘原语的标准化(数据挖掘语言仍缺少统一标准) 关联规则语言规范 MSQL (Imielinski Virmani’99) MineRule (Meo Psaila and Ceri’96) Q
您可能关注的文档
- 2017年新版13荷叶圆圆第二课时.ppt
- 2017年中考浮力复习1.ppt
- 2017年中考英语总复习-夯实基础-八下-Units-3-4课件-人教新目标版.ppt
- 2018-0610电动、气动工具安全管理.ppt
- 2018-0408化工企业常见隐患排查治理.ppt
- 2018版:工业地域的形成和工业区.ppt
- 2018版:区域工业化与城市化——以我国珠江三角洲地区为例.ppt
- 2018部编版语文一年级下册13荷叶圆圆最终公开课.ppt
- 2018版高考生物全国版大一轮复习应试基础必备课件第十三章生态系统及生态环境保护.ppt
- 2018届高考物理一轮复习基础夯实多维课堂专题7电磁感应现象中的电路和图象问题.ppt
最近下载
- 公共经济学课件.pptx VIP
- 危险性较大分部分项工程监理细则(广东).pdf VIP
- 柯美C450数码复印机故障代码及维修模式.pdf VIP
- 新目标(第二版)视听说B3U3 测试试卷答案.pdf VIP
- 高中心理健康“生涯规划”第二课时《生涯变局——“我”的生涯故事》 教学设计.docx VIP
- 新课标水平三体育教案合集.pdf VIP
- 高中心理健康“生涯规划”第二课时《生涯变局——“我”的生涯故事》 课件.pptx VIP
- 企业职工伤亡事故分类.docx VIP
- 2025年临床检验科常规检验操作规范考核试题及答案解析.docx VIP
- 北京景山四年级上册数学专项复习8:应用题专练2.docx VIP
文档评论(0)