- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要尽管对KDD技术的研究已经取得了丰硕的成果,但是进一步研究KDD技术
摘要
尽管对KDD技术的研究已经取得了丰硕的成果,但是进一步研究KDD技术 仍然具有重要的实际意义。众多的理论和工具都已经成功地应用于解决KDD过程 中的某些具体问题,粗集理论是其中最具发展前景的工具之一。由于基于粗集模 型的智能数据分析过程可以不依赖外界参数或先验知识,因此粗集理论具有其它 工具无法比拟的优势,研究基于这一理论的KDD技术就有望为KDD过程提供更 为理想的解决方案。
在KDD的数据集成阶段,数据离散化是其中一件非常重要的工作。有效的离 散化可以显著地提高系统对样本的聚类能力,增强系统对数据噪音的鲁棒性。粗 集理论已经成功地应用于数据离散化。论文对典型的基于粗集模型的启发式数据 离散化过程进行了深入研究:首先提出了新的计算候选断点集合的方法,在同样 能够保证系统分辨关系的前提下,按照该方法得到的候选断点集合的基数远远小 于按传统方法得到的结果;其次,论文研究了通过“断点分辨矩阵”来度量候选 断点重要性的启发式方式。度量候选断点的重要性不但要考虑该矩阵的列方向特 征,而且还要以适当的方式考虑矩阵的行方向特征。但是,列和行方向特征对候 选断点重要性的反应能力是不对称的,后者不如前者准确。在此基础上,定义“断 点选择概率”来度量断点的重要性。断点选择概率不但具有明确的物理意义,而 且充分考虑了“断点分辨矩阵”列和行方向特征的差异,将这两个方向的特征合 理地统一起来。最后,提出了基于断点选择概率的结果断点集合计算方法。算法 分析和仿真实验结果表明,所提出的算法可以高效率和高性能地解决数据离散化 问题。
在KDD的数据集成阶段,特征子集选择是其中另一件非常重要的工作。特征 子集选择不但可以缩减学习系统的规模,而且能够有效地从系统中剔除冗余信息, 从而凸显系统中数据之间潜在的相互联系,最终能够提高数据挖掘结果的应用性 能和应用精度。论文深入研究了特征子集选择技术,提出了高效的属性核计算方 法,定义了“系统熵”概念,并以属性对系统熵的影响为启发式依据来度量属性 之间的相对重要性。系统熵的计算较“条件熵”简单,并且能够有效地克服条件 熵的不足,不但能够度量系统中非冗余属性之间的相对重要性,而且能够分辨冗 余属性之间的相对重要性。论文揭示了系统熵的一些代数性质,研究了它在取值 规律上的固有倾向。在有效地抵消了其固有取值倾向的影响之后,基于系统熵概 念定义了“属性重要性”概念,并将其应用到反向删除方式的特征子集选择算法
重庆大学博士论文中。算法分析和仿真实验结果表明,所提出的算法能够高效率地解决特征子集选
重庆大学博士论文
中。算法分析和仿真实验结果表明,所提出的算法能够高效率地解决特征子集选 择问题,并能够得到比较理想的结果。
由于决策规则本质上是一种以决策属性集合为标签的分类规则,因此决策规 则的学习过程本质上就是样本分类规则的挖掘过程。由于通过传统的基于粗集模 型的学习算法得到的决策规则描述和体现的主要是不同类型样本之间的分辨特 征,不能反映同类型样本之间的共同特征,于是,论文提出了一种新的决策规则 学习算法,该算法能够产生完备的决策规则系统,在规则的学习过程中,不但考 虑了不同类别样本之间的分辨特征,而且也注重提取同类型样本之间的共同特征。 仿真测试结果表明,该算法具有较高的学习精度,并且对系统的不一致性具有较 强的适应能力。
由于对系统的任何智能处理过程都有可能影响到系统的不确定性,因此系统 不确定性的度量方法是一个具有实际意义的重要问题。定量地描述系统的不确定 性有助于观测和跟踪系统不确定性的变化规律,从而据此来分析相应的处理过程 对系统的影响趋势和影响程度,甚至可以在一定程度上反映和评估这些处理方式 的合理性。论文首先分析了现有的基于粗集模型的系统不确定性度量方式,然后 提出对决策信息系统,可以用条件熵来度量其不确定性,分析了条件熵在其取值 规律上与系统不确定性概念之间的一致性;对决策规则系统,首先将系统的不确 定性分为随机性和冲突性两种,分别刻画了它们具体的表现形式,然后给出了相 应的不确定性度量方法。最后研究了系统不确定性对典型的决策规则学习算法性 能的影响,得到了一些有益的结论。
关键词
粗集理论,数据离散化,特征子集选择,系统不确定性度量,决策规则学习
Ⅱ
垡!型——Abstract
垡!型——
Abstract
Though rich achievements of the researches technologies for Knowledge Discovery from Databases have been reported and seen recently,to further develop new technolog
您可能关注的文档
- 基于粗糙集和包含度的聚类分类算法研究-计算机技术专业论文.docx
- 基于超动态能力的集群企业自主创新机制及绩效研究-工商管理;技术经济及管理专业论文.docx
- 基于粗糙集和贝叶斯的电网故障诊断系统的研究应用-计算机软件与理论专业论文.docx
- 基于超短期负荷预测的变电站综合调压研究-电气工程专业论文.docx
- 基于超短期负荷预测的变电站综合调压研究-控制理论与控制工程专业论文.docx
- 基于粗糙集和关联规则的医学图像分类方法研究-计算机技术专业论文.docx
- 基于粗糙集和可信度的绝缘子泄漏电流预测系统-高电压与绝缘技术专业论文.docx
- 基于超短期负荷预测的智能备自投在线投退系统-电气工程专业论文.docx
- 基于粗糙集和粒子群优化BP神经网络的故障诊断方法研究-载运工具运用工程专业论文.docx
- 基于粗糙集和论域最近邻的协同过滤推荐系统研究与实现-计算机应用技术专业论文.docx
- 基于超循环理论的激励机制研究-企业管理专业论文.docx
- 基于超循环理论的品牌可持续竞争力研究-企业管理专业论文.docx
- 基于粗集理论的股价走势预测-计算机应用技术专业论文.docx
- 基于超循环理论的制造业技术创新机理究-企业管理专业论文.docx
- 基于粗集理论的关联规则挖掘的分析-计算机应用专业论文.docx
- 基于超循环理论的专业市场演化研究-区域经济学专业论文.docx
- 基于粗集理论的关联规则挖掘的研究-计算机应用技术专业论文.docx
- 基于超循环理论的组织学习研究-企业管理专业论文.docx
- 基于粗集理论的关联规则挖掘研究-计算机应用技术专业论文.docx
- 基于超氧化物歧化酶的生物传感器的研究-应用化学专业论文.docx
文档评论(0)