数据挖掘CHAPTER4数据挖掘原语、语言和系统结构.docVIP

  • 5
  • 0
  • 约2.59万字
  • 约 18页
  • 2017-08-27 发布于安徽
  • 举报

数据挖掘CHAPTER4数据挖掘原语、语言和系统结构.doc

第四章 数据挖掘原语、语言和系统结构 关于数据挖掘,一个流行的错误观点是:期望数据挖掘系统能够自动地挖掘出埋藏在给定的大型数据库中的所有有价值的知识,而不需要人的干预或指导。尽管有一个自动数据挖掘系统看上去是吸引人的,但在实践中,它将不可能涵盖大部分模式集。所产生的全部模式的大小很容易超过给定的数据库。让数据挖掘系统“放纵”地去发现模式,而不提供用户希望探查数据库的哪些部分,什么样的模式用户感兴趣,就是放纵数据挖掘“怪物”。所发现的大部分模式与用户的分析任务无关。此外,尽管有些模式与分析任务有关,但是它们可能太难理解,或缺乏有效性、新颖性或实用性——使得它们不令人感兴趣。这样,产生、存放或提供由给定的数据库可能发现的所有模式既不现实,又不是所期望的。 一个更现实的做法是:希望用户能够通过使用一组数据挖掘原语与数据挖掘系统通讯,以支持有效的和有成果的知识发现。这组原语包括说明数据库的部分或用户感兴趣的数据集(包括感兴趣的数据库属性或数据仓库维),要挖掘的知识类型,用于指导挖掘过程的背景知识,模式评估兴趣度量和如何显示所发现的知识。这些原语允许用户在知识发现时与数据挖掘系统通讯,从不同的角度和深度审查发现结果,并指导挖掘过程。 可以设计数据挖掘查询语言集成这些原语,允许用户自由地与数据挖掘系统交互。数据挖掘查询语言也为建立友好的图形用户界面提供了基础。此外,为了实现数据挖掘系统,一

文档评论(0)

1亿VIP精品文档

相关文档