- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN106991296-CN201710209168-基于随机化贪心特征选择的集成分类方法
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 106991296 A
(43)申请公布日
2017.07.28
(21)申请号 201710209168.7
(22)申请日 2017.04.01
(71)申请人 大连理工大学
地址 116024 辽宁省大连市甘井子区凌工
路2号
(72)发明人 孟军 张晶
(74)专利代理机构 大连理工大学专利中心
21200
代理人 温福雪 侯明远
(51)Int.Cl.
G06F 19/24(2011.01)
权利要求书3页 说明书8页 附图2页
(54)发明名称
基于随机化贪心特征选择的集成分类方法
(57)摘要
一种基于随机化贪心特征选择的集成分类
方法,属于生物信息学和数据挖掘领域,对植物
胁迫响应相关的基因表达数据进行分类。包括如
下步骤:(1)在传统的贪心算法中引入随机性进
行特征选择;(2)使用在复杂网络中作为社区发
现评价指标的加权本地模块化函数作为随机化
贪心算法的启发信息;(3)在每个特征子集上使
用支持向量机算法训练基分类器;(4)对基分类
器采用近邻传播聚类算法进行聚簇划分;(5)使
用聚簇中作为类代表点的基分类器进行集成,采
用简单多数投票法形成集成分类模型。本发明能
够根据基因表达数据识别植物样本是否受到胁
A 迫,极大的提高了对微阵列数据的分类精确度,
6 而且算法的泛化能力强,具有非常好的稳定性。
9
2
1
9
9
6
0
1
N
C
CN 106991296 A 权 利 要 求 书 1/3页
1.一种基于随机化贪心特征选择的集成分类方法,其特征在于,步骤如下:
(1)在传统的贪心算法中引入随机性进行特征选择
随机选取第一个特征,来扩大对特征的搜索空间;
(2)将在复杂网络中作为社区发现评价指标的加权本地模块化函数,作为随机化贪心
算法的启发信息
复杂网络的特性有小世界、无标度和社区结构,本集成分类方法将数据挖掘技术与复
杂网络相结合,使用复杂网络中社区发现的评价指标作为启发信息进行特征选择;
加权本地模块化函数计算过程如下:
1)构建加权无向图G(V,A),其中,基因微阵列数据集中的样本作为图中的顶点,对于任
意两个顶点v 和v ,如果v ∈k-NN(v)或v ∈k-NN(v),则两个顶点之间存在权重为WE=exp
1 2 1 2 2 1
(-d(v,v))的边;k-NN(v)包含顶点v 的k近邻,d(v ,v)为两个顶点之间的距离;
1 2 1 1 1 2
2)依据样本的类别自然地对样本进行社区的划分
3)对于每个特征子集,计算其基于加权本地模块化函数的重要度,表达式如下:
其中:c为待分类基因微阵列数据集的类别数量;w 是在第i个社区中内部边权重的总
i
和;W 是社区i中内部边加上邻接边权重的总和;v 是社区i中所有顶点的度的总和,顶点的
i i
度代表与其邻接的边的权重总和;
引入随机性的基于加权本地模块化函数的特征选择过程如下:
1)设置当前的特征子集F={};
2)随机选取一个特征加入到F中;
3)对于每个不包含在F中的特征g,依据属性集合F+{g
您可能关注的文档
- CN107016126-CN201710336188-一种基于序列模式挖掘的多用户模型移动轨迹预测方法.pdf
- CN107016062-CN201710155368-一种试听作弊行为识别方法及系统.pdf
- CN107016040-CN201710034683-展示数据变化原因的方法及装置.pdf
- CN107016036-CN201611227507-用于管理个人媒体项目的方法和设备.pdf
- CN107015993-CN201610058562-一种用户类型识别方法及装置.pdf
- CN107015987-CN201610056622-一种更新和搜索数据库的方法及设备.pdf
- CN107015961-CN201610053813-一种文本相似性比对方法.pdf
- CN107015892-CN201710203394-一种压力测试方法、装置和系统.pdf
- CN107015863-CN201611070427-一种资源分配方法和装置.pdf
- CN107015567-CN201710464859-一种超大尺度柔性航天器分散协同控制方法.pdf
- CN106991293-CN201710344813-一种重症疾病早期沟通系统、方法及沟通仪.pdf
- CN106991255-CN201710309545-一种通过桥面系控制铁路大跨度斜拉桥刚度的方法.pdf
- CN106991145-CN201710178551-一种监测数据的方法及装置.pdf
- CN106991132-CN201710135123-一种基于图集重构与图核降维的图分类方法.pdf
- CN106991084-CN201710192657-一种文档评估方法及装置.pdf
- CN106990763-CN201710262112-一种基于数据挖掘的立磨运行调控系统及方法.pdf
- CN106990370-CN201710215943-一种隔离式超导磁储能系统失超检测设备.pdf
- CN106990141-CN201710355280-一种炉水电导率计算方法及系统.pdf
- CN106990128-CN201710216429-区域尾矿库环境风险评估中斑块影像和污染特征耦合方法.pdf
- CN106990120-CN201710300938-一种太阳能电池片的质量检测方法及其检测装置.pdf
原创力文档


文档评论(0)