- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于概念格的分类规则提取算法及其应用.pdf
基于概念格的分类规则提取算法及其应用8
胡立华张继福张素兰
太原科技大学计算机科学与技术学院太原030024
摘要:概念格是形式背景分析中的核心数据结构,分类规则是数据挖掘一项很重要的任务。本文
首先给出了一种分类概念格渐进式构造算法,并在此算法基础上给出了分类规则的提取算法,理论表
明了分类概念格要比一般概念格构造的效率高、复杂度小.最后采用恒星天体光谱数据作为形式背景,
验证了分类概念格的有效性及分类规则提取的准确性。
关键词:概念格分类概念格分类规则最小上界天体光谱数据
1引 言
概念在哲学中被理解为由内涵和外延两个部分所组成的思想单元,基于概念的这一哲学理解,德国的R
COllC印t
Wille教授于1982年提出了形式概念分析(formalanalysis)…,用于概念的发现、排序和显示。在形式
概念分析中,概念的外延被表示为属于这个概念的所有对象的集合,而内涵则表示为所有这些对象所共有
的特征(或属性)集合,从而实现了对概念的哲学理解的形式化。概念格从本质上描述了对象和特征(属性)之
间的关系,表明了概念之间的泛化和例化关系,而其相应的Hasse图则实现了对数据的可视化。概念格以其
知识表示的直观、简洁和完备特点而受到研究者的关注,并已在软件工程、知识工程、知识发现等领域得到
了广泛的应用∞1。
概念格中的每一个节点代表了训练集的子空间,因此非常适合分类规则的提取。但是,在基于概念格
的分类规则的提取过程中,往往存在一些冗余规则,这些规则会影响到分类的有效性和准确率。因此,可
以通过一定的策略来消除这些冗余规则以提高分类的准确率。本文以概念格作为基础,通过分析了概念格
和分类规则之间的关系,给出了一种分类概念格渐进式构造算法,并在此算法基础上给出了分类规则的提
取算法,理论表明了分类概念格要比一般概念格构造的效率高、复杂度小。最后采用恒星天体光谱数据作
为形式背景,采用VB和Oracle9i为开发工具,设计与实现了基于概念格的恒星光谱数据分类规则挖掘系统,
从而验证了分类概念格的有效性及分类规则提取的准确性。
2基本概念
元偏序关系,由这个二元偏序关系可以形成一个概念格L。
称为概念格的外延,B∈P(D)称为概念格的内涵。
定Y,3:概念格L对于关系R是完备的,即对于L中的任一节点c(A,B),满足以下两个条件:
(1)“B)=A=B’={a∈OIVbeB,aRbl
(2)f’(A)=B=A7=(b∈DIVaEA,aRb)
+基金资助:国家自然科学基金项目资助。
222 计算机技术与应用进展·2006
定义4:设Cl=(Al,B1)和c2=(A2,B2)是概念格L的两个不同的结点,
存在c3=(Aj.B3)有Cl《水c2成立,则称CL是C2的直接例化,c1是c2的子节点,也可以称为C1是C2的子概念,
3基于分类规则的概念格渐进式构造算法
因为分类要由类标号属性确定。因此分类概念格的形式背景与一般概念格的形式背景有所不同,如下
定义:
R是O与DIuD2之间存在的_个二元偏序关系,由这个二元偏序关系可以形成一个分类概念格FL。
在一般概念格的渐进式构造过程中,生成的节点有可能不包含类标号属性,此类节点对分类规则的提
取没有任何作用,只会增加构造格的时间。因此,在概念格的分类规则提取的过程中,应该将此类节点删
除。
定义6.在一般概念格中,如果节点C(A,B)不包含类标号属性cIa,即cL畦B,则C(A,B)称为虚节点。
节点。
定理.虚节点的父节点仍然是虚节点。
的分类提取规则中,若节点c不包含类标号属性,即类标号属性c1醒B,则cl醒Bl,由定义7可知,虚节点C
的父节点C,仍然是虚节点。
从上面的定义可知,一般概念格的节点可以分为两种节点:虚节点或候选节点。虚节点对概念格分类
规则的提取没有任何影响,因此,概念格中的虚节点可以看作分类概念格中的冗余信息。
基于上述分析,分类概念格的构造方法是:分类概念格从分类形式背景中构造出来,在分类概念格的
渐进式构造过程中,如果生成了虚节点
文档评论(0)