试论生物信息学中模式识别技术的应用与发展.docVIP

试论生物信息学中模式识别技术的应用与发展.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
试论生物信息学中模式识别技术的应用与发展

试论生物信息学中模式识别技术的应用与发展 黄沐也 湖南师范大学附属中学 X 关注成功! 加关注后您将方便地在 我的关注中得到本文献的被引频次变化的通知! 新浪微博 腾讯微博 人人网 开心网 豆瓣网 网易微博 摘????要: 随着互联网和计算机的普及, 现代社会的数据多以高维信息的形式呈现在大众生活中, 人们很难在高维信息中辨别数据的真实性并寻找到所需要的信息。模式识别技术的应用依据是不同物质具有不同特性, 通过计算样本间距离的方式归类新样本, 该技术已经被广泛的应用在了生物信息学中, 本文对此进行了分析。 关键词: 生物信息学; 模式识别技术; 应用方向; 生物信息学是一门融合了计算机技术和生物技术的新型学科, 通过对生物实验数据的汇总、分析、加工, 揭示生物学研究和应用的意义, 其应用代表是人类基因组计划和生物制药工程, 模型识别具有降维、识别、分类等功能, 因此在生物信息学中取得了比较显著的应用效果, 相关专家在实验数据中总结了很多规律。 1 人工神经网络 人工神经网络是用大量简单处理单元连接而成的网络结构, 能够模拟生物的神经网络, 展现其基本特征和结构, 是由简单神经元按照一定的拓扑结构组成的, 该网络体系所具备的行为十分复杂, 属于一个非线性操作系统, 在处理非线性较强和不确定因素较多的问题上占有较多优势。近些年来研究人员开始将人工神经网络技术应用在生物信息数据处理中, 具体有DNA分类、人类基因辨别、生物蛋白质结构分解、基因表达排序等。目前相关专家已经应用模式识别技术提取了20种已知DNA的特征, 随后根据神经的适应性对不同类型的DNA进行排序。另外人工神经网络还在识别编码程序上有良好的应用效果, 如识别不同类型的基因, 分网络连接系统等。 在脱氧核糖阵列和高通监测技术不断发展的过程中, 基因表达法已经被广泛的应用在肿瘤细胞研究中, 专家应用分析灵敏度的方式来提取了基因特征, 再结合人工网络某分析某种肿瘤细胞生理状态, 分类识别后获得分型结果。据研究实现的成果显示, 人工神经网络在淋巴瘤判断和治疗上有着重要作用, 集成神经元网络的应用效果比单个神经元的应用效果更加明显。 2 支撑向量机 支撑向量机在模式识别方面的应用范围比较广阔, 属于一种能够监督和学习的应用方式, 其运行过程如下:通过线性转换的方式将进入的空间升级为高纬度空间, 在转换后空间内设立线形分界面, 随后进行对未知样本探索和分类, 这种转换方式比较适合内积函数。支撑向量机比较适合解决小样本问题, 在生物体基因表达中有着显著的应用效果, 专家应用该方法实现了肿瘤分型, 其实验成功率高达100%。 3 主成分分析法 主成分分析是一种能够处理多变量数据并应用现行投影法将其展现出来的技术, 能够在最大限度保留原有数据的基础上, 将高纬度空间中的信息转移到较低维度的空间中, 降低数据的处理分析难度, 与次同时技术人员要提取原始变量, 即线性组合中的主要成分, 以此为依据分析数据的结构特征, 提取其中包含的生物信息和医学信息。 主成分分析法既可以应用在分类判别中又可以应用在聚类处理中, 在得出的投影图中, 可以看出样本与样本、数据与数据之间的关系。一些专家在应用主成分分析法时, 从研究致癌物质的电子参数入手, 分析了电子参数和致癌物质活跃程度的关系。另外投影图的实验可以应用在植物病理研究中, 帮助科研人员发现基因和比较分子序列谱, 生物学专家在20种氨基酸的分析中, 一共收集到了1325个可描述变量, 在这些新型变量中, 人们得到了一种全新的氨基酸描述分子, 简称SZOTT, 研究结果表明, SZOTT所描述的分子信息较多, 且结构表达能力较强, 可以广泛应用在多肽定量关系研究中。某专业团队对比了主要成分分析法和均值聚类分析法的应用效果, 对比结果显示在对组织样品进行分析时, 主成分分析法会提高聚类分类的质量。从分子的量化数据中可以看出, 在已经被量化的24种参数结构中, 当抗生类物质与DNA相互作用时, 有12种参数之间的相互作用力较大, 因此主成分分析法在制造抗癌药物中具有重要的应用价值。 4 聚类分析法 聚类分析法属于一种多元的统计方法, 在很多科学领域有着诸多应用实例, 该技术的应用依据不是通过事先的定义, 而是根据不同数据的特征来达到降维的目的, 因此此类数据的分析以依据又可以被称为物以类聚原则。 聚类分析法在生物信息学中的应用不但表现在分析数列数据上, 还表现在其他问题的处理上, 比如说序列分析。生物学家在实验过程中发现了基因表达的分类方式, 并结合ANN和CA技术识别了细菌的种类和表面吸附物质的光谱信息, 事实证明, 其应用的精准率超过了96%, 胃癌组织中的基因表达特征客观反映了胃癌和非肿瘤性胃癌的区别。应用聚类分析法同样

文档评论(0)

zhengshumian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档