- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
33№.11A
计算机科学2006VoL
基于快速蚁群算法的分类规则发现算法*)
witha Ant
ClassificationRule Quick
Discovering Algorithm
陈俊清朱文兴
(福州大学数学与计算机科学学院福州350002)
在数据挖掘的研究中,预测模型的研究是一个很
重要的问题[¨。而分类是预测的手段之一,因此分类 想;第2节介绍本算法与Ant-Miner算法的区别;第
方法的研究又是至关重要的。目前,国内外常用的分
类方法[z]有统计方法、机器学习方法、粗糙集方法、神 论;最后是总结并提出下一步的研究方向。
经网络方法和遗传算法等。然而,这些方法却存在许
1 Ant-Miner算法[目的简介
多不足之处。例如,用神经网络方法分类的可解释性
差;统计方法需要大量的先验知识而且得出的不是规 该算法实质上是一种序列覆盖算法,利用蚁群算
则形式,不易让用户理解;用遗传算法进行分类,运行 法具有良好的搜索全局最优值(在这里是规则的质
花费的时间长。 量)的特点,搜索出一个质量最好的规则,然后移去该
因此,人们希望分类器得到的是规则的形式,因 规则所正确覆盖的样例,直至最后不能被覆盖的样例
为规则形式容易让客户理解,便于对结果分析,判断 数小于允许最大未覆盖的样例数,则整个训练算法结
它是否合理,以便做出修改。那么进一步要求分类 束,最终算法将得到一组最优分类规则集。
得出的规则预测准确率要高,规则的数目要少,规则 Ant-Miner算法主要包括三个步骤:构造规则,规
的长度要尽量简短。同时,希望算法运行的时间效率 则剪枝和信息素更新。
能够进一步提高。 1.1构造规则 .
目前,把智能技术引入数据挖掘领域已经成为研 ‘1.1.1规则的表示形式
究热点。蚁群算法是最近几年才提出的一种新型的 在算法当中,定义分类的规则形式为:
拟生态系统算法,由意大利学者MDorigo、V. IF(规则前件THEN规则后件
其中规则前件为条件属性,规则后件为决策属性。进
Maniezzo等人首先提出[6a],他们称之为蚁群系统
(AntColonySystem,ACs),并用该方法来求解旅行一步展开具体的形式为:
and
IFterml
商问题(TSP)、指派问题(Assignmentproblem)、Job-
shop调度问题、组合优化问题等,取得了一系列较好词组term为某一个条件属性的取值。特别说明的
的实验结果。 是:同一规则中不能同时出现两个词组属于同一个属
本文提出了一种基于快速蚁群算法的分类规则 性的取值域。
发现算法,就是利用蚁群算法中的信息正反馈原理和 1.1-2如何构造规则
某种启发式算法的有机结合,来搜索全局最优解。本 构造规则,即构造初始解,利用当前蚂蚁反复地
算法模仿蚁群觅食方式来构造分类规则,采用与文 一次一个词组加入规则前件当中,直到再添加任一个
[5]中不同的启发式函数,并且设计了局部搜索算法, 词组将使得规则不能覆盖足够多的样例,然后把当前
同时利用局部信息素更新与全局信息素更新相结合 规则前件所覆盖的训练集中占最多数的类,作为规则
文档评论(0)