- 28
- 0
- 约19.19万字
- 约 81页
- 2020-12-22 发布于江苏
- 举报
摘要
摘 要
粗糙集理论是一种处理不精确性、不完备性和不确定性问题的重要数学工具。由于
经典粗糙集模型的分类条件是一种严格的不可分辨关系,无法直接处理混合型数据和准
确表达生活中的一些模糊概念,导致在实际应用中存在一定的局限性。因此,粗糙集与
其他数学理论结合的粗糙集扩展模型也就应运而生,并且广泛地应用到实际问题的解决
中。属性约简,作为粗糙集扩展模型研究的核心内容之一,在处理信息化时代的不确定
性问题中起到了关键作用,其可以在保持分类能力不变的前提下剔除原属性集中冗余或
无关的属性,提高模型的分类性能。本文针对经典粗糙集模型在实际应用中等价关系的
严格性造成需要离散化数据而使得信息丢失以及无法同时表达决策问题模糊程度的缺
陷问题,开展了基于粗糙集扩展模型的属性约简算法研究。
本文主要研究工作如下:
1. 针对经典粗糙集模型无法直接处理多标记混合型数据和多标记数据中标记空间
存在标记强弱性的问题,提出了多标记邻域粗糙集模型及其属性约简算法ARNRS-ML。
该模型利用样本到其异类样本和到其同类样本平均距离的差值对标记赋予权重,挖掘了
标记对样本的区分性强弱,并在邻域粗糙集框架下提出了新的正域计算方法,有效提高
了正域的计算效率。所提方法克服了经典粗糙集模型在处理混合型数据时需要离散化操
作从而丢失重要信息的缺陷。通过在多标记数据集上进行实验和比较分析,结果表明
ARNRS-ML 算法的分类性能明显优于其他多标记属性约简算法。
2. 针对多标记数据的高维性和数据类型的复杂性对分类性能造成干扰的问题,提出
了多标记变精度模糊邻域粗糙集模型和属性约简算法FNRS-ML。该模型利用参数化的
模糊邻域粒定义了多标记模糊决策和决策类,并结合粗糙集包含度定义了多标记变精度
模糊邻域近似空间,解决了经典粗糙集模型在上、下近似计算时的严苛性。在不同领域
的多标记数据集上进行了大量的实验,结果表明与当前流行的多标记属性约简算法相
比,FNRS-ML 算法不仅可以有效减少属性空间的维数,而且能获得更高的分类性能。
3. 针对经典粗糙集无法同时表达生活中决策问题的接受、反对和犹豫的程度,以及
I
闽南师范大学理学硕士学位论文
大数据时代的实际应用中数据属性维数增多,决策耗时增加的问题,提出了基于包含度
的单值中智粗糙集模型及约简算法。该模型首先定义了单值中智集的包含度公式和相关
基础概念,其次加入变精度参数定义其近似算子,使得实际决策问题更合理,最后利用
具体实例说明所提算法对维数高的数据进行预处理,不仅可以减少决策过程的时间消
耗,还有利于处理信息系统中的不确定信息,同时使得单值中智集对于决策问题的解决
更具有实际意义。
关键词:属性约简;邻域粗糙集;变精度粗糙集;单值中智粗糙集;多标记数据
II
目录
目 录
摘 要I
AbstractIII
第1章 绪论1
1.1 课题背景及意义1
1.2 粗糙集研究现状2
1.3 属性约简技术6
1.3.1 属性约简简述6
1.3.2 研究现状9
1.4 论文主要研究内容11
1.5 论文组织结构12
第2章 相关基础知识15
2.1 粗糙集理论15
2.2.1 经典粗糙集15
2.2.2 变精度粗糙集19
2.2.3 邻域粗糙集21
2.2.4 变精度模糊邻域粗糙集24
2.2 单值中智集26
2.3 包含度27
2.4 本章小结28
第3章 基于多标记邻域粗糙集的属性约简算法29
3.1 引言29
3.2 多标记邻域粗糙集30
3.2.1 标记权重30
3.2.2 多标记邻域粗糙集模型30
3.2.3
原创力文档

文档评论(0)