- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
融合粒子群优化与遗传算法基因调控网络构建
融合粒子群优化和遗传算法的基因调控网络构建 摘 要:MicroRNA(miRNA)是一类大小为21~25nt的内源性非编码小核糖核酸(RNA), 通过与mRNA的3UTR互补结合, 导致mRNA降解或翻译抑制来调控编码基因的表达。为了提高构建基因调控网络的准确度, 提出一种基于粗糙集、融合粒子群(PSO)和遗传算法(GA)的基因调控网络构建方法(PSOGARS)。该方法首先通过对序列信息进行特征提取;然后采用粗糙集的依赖度作为适应度函数, 融合粒子群和遗传算法选出较优的特征子集;最后使用支持向量机(SVM)建立模型, 预测未知的调控关系。在拟南芥数据集上进行实验, 相比基于粗糙集和粒子群优化的特征选择方法和Rosetta算法, 所提方法的预测准确率、F值和受试者工作特征(ROC)曲线面积最多能提高5%, 在水稻数据集上最多能提高8%。实验结果表明所提方法能够比较准确地预测miRNA和靶基因之间的调控关系
关键词:基因调控网络;粒子群优化;遗传算法;粗糙集;特征选择
中图分类号:TP399
文献标志码:A
文章编号:1001-9081(2016)11-2969-05
0 引言
MicroRNA(miRNA) 是一类非常重要的非编码核糖核酸(RiboNucleic Acid,RNA)分子, 通过诱导靶基因降解, 从而广泛地参与到基因的转录后调控, 或者通过抑制基因的转录, 对基因在转录水平上进行调控[1]。miRNA通过与靶mRNA(messenger RNA)匹配结合实现对生物学功能的调控, 因此, 研究miRNA与其靶基因的调控关系成为生物界广泛关注的问题。传统的实验验证方法耗费巨大, 利用现有的序列数据、基因表达数据或其他生物信息学数据, 通过统计学模型或机器学习的方法构建基因调控网络来发现基因之间的关系, 能够有效减少实验花费, 对生物学研究者有一定指导作用
从机器学习的角度来看, 基因调控网络构建可以分为非监督学习和监督学习。非监督学习不需要已知的调控关系, 只是利用一些生物数据来进行调控网络的构建; 监督学习则需要已知的调控关系, 可以看出监督学习需要的数据信息多于非监督学习, 具有更强的发现能力。有研究表明, 在网络推断方面, 监督学习优于非监督学习[2]
监督学习需要利用已有的调控关系数据, 通过学习调控关系的判别模型, 对未知的调控关系进行判别, 需要处理特征生成和分类器选择问题。miRNA与其靶基因的交互特征包括自由能特征、结构序列特征和基于绑定位置特征, 收集这些特征并进行计算, 然后使用分类器进行模型的构建。由于支持向量机(Support Vector Machine, SVM)在解决小样本、非线性以及高维问题中表现出的优势[3], 使得它在基因网络构建方面独具一格, 已成为近期的研究热点
本文提出了一种基于粗糙集、混合粒子群和遗传算法(Genetic Algorithm, GA)的基因调控构建方法。首先利用序列数据构建特征向量, 然后使用所提方法选取最优的特征子集, 构建支持向量机模型。由于存在正负样本不平衡问题, 本文采用SMOTE (Synthetic Minority Oversampling TEchnique)[4] 算法对样本进行处理, 降低类不平衡的影响。在拟南芥和水稻数据集上的实验结果表明该方法可以得到较好的性能
3 遗传算法
遗传算法是一种模拟达尔文生物进化论的自然选择和遗传学机制演化而来的随机化搜索方法[12]。 它采用概率化的寻优方法, 能自动获取和指导优化的搜索空间, 不需要确定的规则, 能够自适应的调整搜索方向, 已经被广泛应用到信号处理、组合优化和机器学习等领域
遗传算法具有粒子群算法所没有的交叉和变异操作。交叉就是按照一个较大的概率从种群中选择两个个体, 交换两个个体的某个或某些位, 从而形成两个新的个体。交叉操作方法有单点交叉、两点交叉、多点交叉和顺序交叉等。常用的交叉算子是单点交叉算子, 是指在个体中随机设置一个交叉点, 然后在该点相互交换两个配对个体的部分染色体
变异操作是模拟生物由于偶然的因素而引起基因突变的原理来进行的。它使用一个很小的变异概率随机将染色体中的某一位或某些位使用其他值进行替换, 从而形成一个新的个体
4 基于粗糙集的PSO和GA的混合算法
虽然粒子群算法中粒子的学习能力很强, 节省时间并且容易实现
但是存在一些缺点:比如局部搜索能力比较差、搜索的精度不高、容易陷入局部最优解等。因此, PSO算法和其他算法的融合是当前的研究热点。Li等[13]在2006年提出将模拟退火算法和PSO进行融合;Ye等[14]在2005年将演化策略的变异算子引入到了PSO中; 文献[15] 在
您可能关注的文档
最近下载
- 垂体功能减退症的护理查房.pptx VIP
- 2023年铁岭卫生职业学院单招面试试题及答案解析.docx
- 《口袋妖怪叶绿》完整图文攻略解析.doc
- 电梯乘载品质振动标准.doc
- 高考数学解答题专项复习:圆锥曲线中的向量问题(典型题型归类训练)(学生版+解析).pdf VIP
- DB42T 1070-2015银杏物候观测方法.pdf
- 高考数学解答题专项复习:圆锥曲线中的三角形(四边形)面积问题(含定值、最值、范围问题)(典型题型归类训练)(学生版+解析).pdf VIP
- 生产主管年终总结.pptx VIP
- 基层医疗机构发热门诊(或诊室)设置标准(含发热门诊、发热诊室设计参考图).pdf
- 高考数学解答题专项复习:圆锥曲线中的定点、定值、定直线问题(典型题型归类训练)(学生版+解析).pdf VIP
文档评论(0)