- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于人工免疫的频繁模式挖掘 人工免疫系统(Artificial Immune System,AIS) 人工免疫系统是受免疫学启发,模拟免疫学功能、原理和模型来解决复杂问题的自适应系统。 人工免疫系统是模仿自然免疫系统功能的一种智能方法,他实现一种受生物免疫系统启发,通过学习外界物质的自然防御机理的学习技术,提供噪声忍耐、无教师学习,自组织、记忆等进化学习机理,结合了分类器、神经网络和机器推理等系统的一些优点。 生物免疫 (1)、抗原 抗原(Antigen一Ag)是指能够刺激和诱导机体的免疫系统使其产生免疫应答,并能与相应的免疫应答产物在体内或体外发生特异性反应的物质。抗原具有两种特性,其一为免疫原性(Immunogenicity),即抗原能刺激特定的免疫细胞,使免疫细胞活化、增值、分化,并最终免疫效应物质(抗体和致敏淋巴细胞)的特性;其二为免疫反应性,即抗原与相应的免疫效应物质在体内或体外相遇时,可发生特异性结合而产生免疫反应的特性。 (3)、抗体 抗体(Antibody一Ab)是指免疫系统受抗原刺激后,B淋巴细胞转化为浆细胞并产生能与抗原发主特异性结合的免疫球蛋白(Immunoglobulin一Ig),该免疫球蛋白即为抗体,所以体有时的简写形式为Ig。 生物免疫系统的模型 相关机理 (1) 记忆学习 (2) 反馈机制 (3) 多样性遗传机理 (4) 克隆选择机理 生物免疫系统和人工免疫算法的对应关系 基本概念和问题描述 基本概念和问题描述 设I={i1,i2,…,in}是二进制文字的集合,其中的元素称为项(item)。 记D为交易T (transaction) 的集合,这里交易T是项(item)的集合,并且T是I的子集。 对应每一个交易T 有唯一的标识,如交易号,记作TID。设X是一个I中的项(item)的集合,如果X包含于T,那么称交易T包含X。 支持度 可信度 min_supp and min_conf 给定一个交易集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度(min_supp)和最小可信度(min_conf)的关联规则。 经典频集方法 Agrawal等在1993年提出一种基于两阶段频集思想的方法,将关联规则挖掘算法的设计分解为两个子问题: (1) 找到所有支持度大于最小支持度的项集(Itmeset),这些项集称为频集(Frequent Itemset)。 (2) 使用第1步找到的频集产生期望的规则。 经典频集方法 典型的频繁项集挖掘算法执行后,所有项目集被划分成下面3种集合: (1) 频繁项目集: 指那些发现是频繁的项目集。 (2) 非频繁项目集: 指那些发现是非项目集 (3) 未归类集: 指其他所有的项目集。 Apriori算法 Apriori算法在形成了k—频繁项集的基础上搜索k+1—候选项集时,由两个k—频繁项集连接产生。一些不符合条件的项目集因为不需要进一步处理被剪除。剩下的项目集就是这一步的候选项目集,第二步计算候选项目集的支持度。 频繁项集挖掘过程的主要花费包括扫描数据库(I/O时间)和新的候选项集产生的时间(CPU)。 事务—项目集信息表 事务数据库 事务信息表 基于免疫算法的频繁模式挖掘算法 抗体编码 抗体每一个单元对应于事务数据库的一个事务的项目集。抗原为候选项目集。抗体的长度与支持度和记录总数相关。按如下公式获得:抗体长度n0=记录数×支持度。如数据库总容量1000,支持度1%,则n0=10,抗体可以编码如下: 亲和力函数 抗体Ab与抗原Ag的亲和度为 新抗体产生 高亲和力个体之间超突变。 亲和力高的个体其产生长频繁项目集,所以高亲和力个体之间超突变加大产生长频繁项目集的概率。 低亲和力的个体自身均匀突变 。 低亲和力个体需要淘汰。 基于免疫算法的频繁模式挖掘算法 step1 初始群体 在C中随机选取n0个项目集组成一个抗体,其中C ∈事务数据D,则可以随机产生n个抗体形成初始抗体群A0。(这里n指抗体群的规模。初始抗原群和初始记忆细胞群均为空。) step2 抗原及记忆细胞获取 计算抗体群An中的抗体亲和度,复制An中亲和度最强的个体,作为记忆细胞加入记忆细胞群,得Mn+1;把An计算亲和度后得到的项目集视为抗原群组合,并用抗原聚类算法获Agn+1。 基于免疫算法的频繁模式挖掘算法 step3 克隆选择 按上一步计算An的亲和度结果,在选择率α下,选择An中s=Int(α|An|) 个较高亲和度的抗体构成Bn1;设Bn1= {Ab1,…,Abs},其中0α1;选择An中t=Int(β|An|) 个较高亲和度的抗体构成Bn2,,设Bn2= {Ab1,…,Abt},其中0β1。 step4 细胞克隆 Bn中的Abi经过细胞克隆选择算子获克隆细胞子群Ci10和Ci
您可能关注的文档
最近下载
- 教案:ABB[a]-J-8ABB机器人高级编程.docx VIP
- 中国慢性冠脉综合征患者诊断及管理指南2024版解读.pptx
- 优秀工程项目管理经验分享.pptx VIP
- JGJT117-2019民用建筑修缮工程查勘与设计标准.docx VIP
- 2021年5月江苏省苏州工业园区初三调研(中考一模)英语试卷及答案.pdf VIP
- 【PDF】2022 年职业教育国家级教学成果奖申报.pdf VIP
- 电机基础知识入门 [(日)井出万盛 著] 2012年_部分10.pdf VIP
- 湘教版七年级地理上册第三章第二节气温和降水课件(共27张PPT)讲解.ppt VIP
- 科研项目中期检查报告书.docx VIP
- 丹江口水库现代化运行管理矩阵构建实践.docx VIP
文档评论(0)