- 5
- 0
- 约2.59万字
- 约 18页
- 2017-08-27 发布于安徽
- 举报
第四章 数据挖掘原语、语言和系统结构
关于数据挖掘,一个流行的错误观点是:期望数据挖掘系统能够自动地挖掘出埋藏在给定的大型数据库中的所有有价值的知识,而不需要人的干预或指导。尽管有一个自动数据挖掘系统看上去是吸引人的,但在实践中,它将不可能涵盖大部分模式集。所产生的全部模式的大小很容易超过给定的数据库。让数据挖掘系统“放纵”地去发现模式,而不提供用户希望探查数据库的哪些部分,什么样的模式用户感兴趣,就是放纵数据挖掘“怪物”。所发现的大部分模式与用户的分析任务无关。此外,尽管有些模式与分析任务有关,但是它们可能太难理解,或缺乏有效性、新颖性或实用性——使得它们不令人感兴趣。这样,产生、存放或提供由给定的数据库可能发现的所有模式既不现实,又不是所期望的。
一个更现实的做法是:希望用户能够通过使用一组数据挖掘原语与数据挖掘系统通讯,以支持有效的和有成果的知识发现。这组原语包括说明数据库的部分或用户感兴趣的数据集(包括感兴趣的数据库属性或数据仓库维),要挖掘的知识类型,用于指导挖掘过程的背景知识,模式评估兴趣度量和如何显示所发现的知识。这些原语允许用户在知识发现时与数据挖掘系统通讯,从不同的角度和深度审查发现结果,并指导挖掘过程。
可以设计数据挖掘查询语言集成这些原语,允许用户自由地与数据挖掘系统交互。数据挖掘查询语言也为建立友好的图形用户界面提供了基础。此外,为了实现数据挖掘系统,一
您可能关注的文档
- 深化对中国特色社会主义的认识.pdf
- 深刻领会和全面把握科学发展观.ppt
- 深入开展心理素质教育有效促进学生全面发展.ppt
- 神华现代煤制油化工工程建设与运营实践.pdf
- 渗透测试实验平台的开发应用.pdf
- 生产与经济制度 2.ppt
- 生产运作与管理课件text5.ppt
- 生成有效的板支持包.pdf
- 生活经济论文民营经济论文.pdf
- 生物化学工程习题.ppt
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
原创力文档

文档评论(0)