kdd中的几个关键问题分析-analysis of some key problems in kdd.docx

kdd中的几个关键问题分析-analysis of some key problems in kdd.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
kdd中的几个关键问题分析-analysis of some key problems in kdd

摘要摘要数据库中的知识发现 (Know/edge Discovery in Database. KDD) 是在应用需 求的背景下产生并迅速发展起来的、开发信息资源的一套科学方法、算法及软件 工具和环境,是集统计学、人工智能、模式识别、并行计算、机器学习、数据库 等技术的一个交叉性的研究领域 ? KDD 是识别有效的、新颖的 、具有潜在用处 的可理解的数据模式的过程。一般地 ? KDD 由数据清理、数据集成、数据选择、 数据交换、数据挖掘、模式(型)评估、知识表示等过程组成。 KDD 有三个重 要的环节,即数据预处理、数据挖掘和结果可视化.本文在详细分析国内外 KDD 研究现状的基础上,借鉴生物进化、计算智能、 关系代数、 petri 网等概念与理论,提出了基于自适应聚类、模糊聚类进行数据 预处理的算法:基于关系代数和自适应混合算法集成的关联规则挖掘算法、泛化 关联规则挖掘算法:分析了分类挖掘机理及文本分类与降维技术:针对现有的数 据挖掘结果的可视化理论及技术,提出了基于 petri 网的鲁棒性的、统一的可视 化模型:最后,实现了一个数据挖掘的应用实例,验证了文中有关算法和方法的 有效性.主要研究内容如下 z(1)数据预处理是确保数据拢掘成功的关键,文中将数据库理论与自适应 并行优化算法相结合,给出了 KDD 与数据库/数据仓库无缝集成的 κDD 模型, 并提出了基于自适应聚类与并行优化算法混合的数据预处理算法。仿真实验证明 了算法的有效性,该算法可用于分类、聚类、关联规则等数据挖掘的预处理,并 可推广到不同类型数据的数据预处理中。(2) 在数据预处理的基础上.提出了利用关系代数理论、数据库与 KDD 协 同理论挖掘关联规则、泛化关联规则的算法,仿真结果表明了算法的有效性.与 经典的 Apriori 算法相比,该算法只需扫描一次数据库,具有良好的并行性和可 伸缩性,并易于推广到模糊关联规则的挖掘。(3)分类是数据挖掘的主要应用之一.文中绘出了分类挖掘的形式化定义, 分析了分类挖掘的基本机理.在此基础上,提出了一种 Web 文档分类的基本框 架,分析了用于文挡分类的降维技术,给出了基于主分量分析和支撑矢量机的文 裆分类的基本思想,分析了仿真实验的结果。(4)数据挖掘结果及数据挖掘过程的可视化表示是 KDD 的又一个重要的组 成部分。在分析了现有可视化理论及表示方法的基础上,针对其不足,提出了用 petri 网表示挖掘过程及挖掘结果的统-的、鲁棒性的框架,该方法也适用于动 态如11;11/ 的可视化表示.(5) 以陕北黄土高原多个地貌区为试验样区,在数字高程模型 CDEM) 所提取的数据集的基础上,挖掘各种地形因子对平均坡度的影响程度(国家自然科霄达信号处理回家重点实验室 11KDυ 中t 内儿大ríY Ii!是II州f{. 学基金项目 (4997106S)、国家高技术研究发展计划课题 (2001AA130023) ).以 建立适合黄土高原多种地貌类型的 ? DEM 所提取的地面坡度随分辨率与地形变 化的模型 a 实验结果具有很高的精度,证明了文中有关算法和方法的有效性。将 KDD 和数据挖掘理论与算法用于地字信息处理是一种新的尝试,挖掘结果既有 效地估算了地理空间数据的不确定性、非线性的关系特征,又从一个侧面揭矛了 黄土高原 DEM 地形信息容量变化的规律性,为建立黄土高原地形信息图谱提供 了重要素材。关键词:KDD 数据挖掘 自适应聚类兔疫遗传算法效措预处理 关联规则泛化关联规则文裆分类 petri 网主分量分析 可视化虚拟数据库多层数据库西安电子科技大学博+学价论文Abstract111AbstractKnowledge discovery in database is a rapidly growing field,whose development is driven by strong research interests as well as urgent practical ,social,and 倪。nomical needs. KDD is a suit of scientific method ,algorithm ,so企ware tool andenvironment and can be used to develop information resources. KDD is a multi-disciplinary cross research field,including statistics,artificial intelligence , pattem recognition ,parallel compu

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档