- 2
- 0
- 约5.24万字
- 约 55页
- 2018-06-08 发布于贵州
- 举报
关于粗集的不完备信息系统数据挖掘要领研究
中文摘要
摘要
粗糙集理论是上世纪八十年代初由波兰数学家Pawlak首先提出的一种新的
处理不精确、不完全与不相容知识的数学理论。其主要思想是利用已知的知识或
信息来近似不精确的概念或现象。自上世纪九十年代以来,粗糙集在理论上不断
完善,在应用上广泛扩展,己逐渐成为国际学术界的研究热点之一。
在经典粗糙集中,论域上的等价关系起着至关重要的作用。但在现实中,论
域上的二元关系经常不是等价的,此时经典粗糙集模型的应用受到限制。在不完
备信息系统中,建立一种什么样的二元关系,是进一步研究不完备信息系统的粗
计算、知识约简以及规则提取的基础。本文从经典粗糙集模型中的等价关系入手,
把多数包含关系引入到不完备信息系统中定义了一种变精度模型,对不完备信息
系统的粗糙集模型进行了扩充,这种扩展模型是原来模型的推广和改进,既保留
了原来模型的优点又丢弃了原来模型的缺陷,增强了粗糙集模型的抗噪声的能力。
实际数据库中存在较多的连续型数值属性,而现有的很多数据挖掘方法只能
处理离散型的属性,因而需要对连续属性进行离散化,已经出现了多种连续属性
离散化算法,且各有特色和优劣。本文以信息增益作为属性重要性的度量方法,
以基于最小描述长度原理的决策系统信息熵作为离散化过程的评价函数,提出了
一种改进的连续属性离散化算法。该算法不仅考虑了连续属性的属性值之间的序
关系,也考虑了属性值之间的相对距离关系。
关键字:不完备信息系统;粗糙集;扩展模型;离散化
英文摘要
ResearchtoData of Information
Incomplete System
Mining
Basedon Set
Rough
Abstract
in
set Pawlakthe 1 amathematical
980s,is
Roughtheory,proposedby early
for aboutdata.Themain ofthe isto
theory idea inexact,
reasoning theoryapproximate
uncertain ofavmlable orinformation.Since1 has
conceptsusing knowledge 990s,it
by
attractedmuchattentionofresearchersaroundthe hasbecome
wodd.Now,thistheory
aflash intheresearchalgaof scienceandinformationscience.
poiIlt computer
In
classical relations roles.In
Set,theequivalenceplay fact,the
Rough
您可能关注的文档
最近下载
- 科达监控平台2.0的介绍及配置.ppt
- 基本能力测验三支一扶考试试题及答案指导(2024年).docx VIP
- 2025-2026学年浙江杭州学军中学高二上学期1月月考数学试卷含详解.docx VIP
- 山东省德州市乐陵市2024-2025学年七年级上学期1月期末数学试题.docx VIP
- 中大班-社会-非遗里的春节-课件(互动版).pptx VIP
- 2023龙岩市物理八年级上册期末试卷.doc
- 山东省德州市乐陵市2024-2025学年七年级上学期1月期末数学试题.docx VIP
- 广东省2025三支一扶考试真题.docx VIP
- 农村三资管理报账流程.pptx VIP
- 3D3S简介桁架87课件讲解.pptx VIP
原创力文档

文档评论(0)