- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘知识点整理_光环大数据培训精选
光环大数据--大数据培训知名品牌
数据挖掘知识点整理_光环大数据培训
光环大数据培训机构了解到,1. 数据、信息和知识是广义数据表现的不同
形式。
2. 主要知识模式类型有: 广义知识,关联知识,类知识,预测型知识,特
异型知识
3. web 挖掘研究的主要流派有: Web 结构挖掘、Web 使用挖掘、Web 内容挖
掘
4. 一般地说,KDD 是一个多步骤的处理过程,一般分为问题定义、数据抽
取、数据预处理、.数据挖掘以及模式评估等基本阶段。
5. 数据库中的知识发现处理过程模型有:阶梯处理过程模型,螺旋处理过
程模型,以用户为中心的处理结构模型,联机KDD 模型,支持多数据源多知识模
式的KDD 处理模型
6. 粗略地说,知识发现软件或工具的发展经历了独立的知识发现软件、横
向的知识发现工具集和纵向的知识发现解决方案三个主要阶段,其中后面两种反
映了目前知识发现软件的两个主要发展方向。
7. 决策树分类模型的建立通常分为两个步骤: 决策树生成,决策树修剪。
8. 从使用的主要技术上看,可以把分类方法归结为四种类型:
a) 基于距离的分类方法
b) 决策树分类方法
c) 贝叶斯分类方法
d) 规则归纳方法
9. 关联规则挖掘问题可以划分成两个子问题:
a) 发现频繁项目集:通过用户给定Minsupport ,寻找所有频繁项目集或者
光环大数据
光环大数据--大数据培训知名品牌
最大频繁项目集。
b) 生成关联规则:通过用户给定 Minconfidence ,在频繁项目集中,寻找
关联规则。
10. 数据挖掘是相关学科充分发展的基础上被提出和发展的,主要的相关技
术:
数据库等信息技术的发展
统计学深入应用
人工智能技术的研究和应用
11. 衡量关联规则挖掘结果的有效性,应该从多种综合角度来考虑:
光环大数据
光环大数据--大数据培训知名品牌
a 准确性:挖掘出的规则必须反映数据的实际情况。
b 实用性:挖掘出的规则必须是简洁可用的。
c 新颖性:挖掘出的关联规则可以为用户提供新的有价值信息。
12. 约束的常见类型有:
单调性约束;
反单调性约束;
可转变的约束;
光环大数据
光环大数据--大数据培训知名品牌
简洁性约束.
13. 根据规则中涉及到的层次,多层次关联规则可以分为:
同层关联规则:如果一个关联规则对应的项目是同一个粒度层次,那么它是
同层关联规则。
层间关联规则:如果在不同的粒度层次上考虑问题,那么可能得到的是层间
关联规
14. 按照聚类分析算法的主要思路,聚类方法可以被归纳为如下几种。
划分法:基于一定标准构建数据的划分。
光环大数据
光环大数据--大数据培训知名品牌
属于该类的聚类方法有:k-means、k-modes、k-prototypes、k-medoids、
PAM、CLARA、CLARANS 等。
层次法:对给定数据对象集合进行层次的分解。
密度法:基于数据对象的相连密度评价。
网格法:将数据空间划分成为有限个单元(Cell)的网格结构,基于网格结构
进行聚类。
模型法:给每一个簇假定一个模型,然后去寻找能够很好的满足这个模型的
数据集。
15.
您可能关注的文档
- 数学:10.3《数据的表示》课件(北京课改版七年级下)精选.ppt
- 数学:1.5《测量物体的高度》课件(北师大版九年级下)精选.ppt
- 数学:10.7《众数》课件(北京课改版七年级下)精选.ppt
- 数学:10.8《中位数》课件(北京课改版七年级下)精选.ppt
- 数学:16.1《分式》(第1课时)课件(人教新课标八年级下)精选.ppt
- 数学:15.8《第十五章复习》课件(北京课改版八年级下)精选.ppt
- 数学:11.2《分式的基本性质》课件1(北京课改版八年级上)精选.ppt
- 数学:19.1 比例线段 课件(北京课改版九年级上)精选.ppt
- 数学:2.2-第1课时《同类项》课件(人教版七年级上)精选.ppt
- 数学:2.4《第二章复习》课件(湘教版七年级下)精选.ppt
最近下载
- 11J930住宅建筑构造图集.docx VIP
- GeoGebra5经典版脚本应用入门20190306.pdf VIP
- 薛瑞萍(看云)《心平气和的一年级》.pdf VIP
- DB37∕T 3981.1-2020 古树名木管理规范 第1部分:档案管理.docx VIP
- 实时荧光定量PCR.pptx VIP
- 船舶应急发电机的PSC检查.doc VIP
- 中国国家标准 GB/T 1040.1-2025塑料 拉伸性能的测定 第1部分:总则.pdf
- 古树名木管理规范 第2部分:养护与复壮技术规程.docx VIP
- (2025秋新版)人教版二年级数学上册《 乘法的初步认识》PPT课件.pptx
- 11J930住宅建筑构造.pptx VIP
文档评论(0)