- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于GC-MS的高速谱库探索算法研究-模式识别与智能系统专业论文
独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的
独创性声明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得安徽大学或其他教育机构的 学位或证书丽使用过的材料。与我一同工作的同志对本研究所做的任何贡献均巴 在论文中作了明确的说明并表示谢意。
洲 张落韵茹1㈣期:消年j月矽日
学位论文版权使用授权书
本学位论文作者完全了解安徽大学有关保留、使用学位论文的规定,有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阂。 本人授权安徽大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影审、缩印或扫描等复裁手段保存、汇编学位论文。
(保密的学位论文在解密后适用本授权书)
学位论文作者签名: 物第} 导师签名: 多涉;譬乒治愿
签字日期:州玉年3-月汐日 签字日期:少f厂 年厂月≯日
万方数据
摘要摘要
摘要
摘要
化合物识别主要通过质谱库相似性搜索实现的。近年来,随着质谱库中可用 质谱数据的迅速增加,这就需要一个高识别率,高速搜索的库搜索算法。本文中 我们将七种相似性度量结合在一起并利用它们的识别差异性来提高识别率,即多 元组合相似性度量算法(Multiple Similarity Measures,MUL SM)。七种相似性
度量:绝对距离度量(Absolute Value Difference,ABS VD)、欧几里得距离度量
(Euclidean distance,Euclidean)、余弦相关系数度量(Cosine Correlation,Cosine)、 相关系数度量(Correlation)和Stein和Scott提出的复合相似性度量(以下简称 SS)、以及基于离散傅里叶变换和小波变换的复合相似性度量(Discrete Fourier and wavelet transforrn composite similarity measure,DFTR和DWTD)并利用粒子 群优化算法(Particle Swarm Optimization,PSO)来设定这七种不同相似性度量 在MUL SM中所占的权重值。同时,为了减少库搜索计算时间,从七种相似性 度量中选择一种度量作为“滤波器(构建子搜索主库)。根据库搜索计算时间、 识别率和分子结构相似性解释能力三种性能,最终选定ABS.VD作为原始搜索 主库的“滤波器”。
传统质谱库搜索的数据基本上是原始的气相色谱.质谱联用(Gas Chromatography Coupled to Mass Spectrometry,GC-MS)数据,样本量多且数据 的维数较高,从而导致库搜索速度较为缓慢。所以本文中提出了一种基于随机映 射位置敏感哈希(Location Sensitive Hash,LSH)的库搜索算法实现了高速、高
效的库搜索算法。 本文主要研究内容如下:
1、针对传统单一相似度量算法低识别率的问题,提出了MUL—SM。本算法 主要内容如下:识别差异性的可视化和粒子群优化算法选择权值。实验表明 MUL.SM相较于七种单一相似性度量算法具有更高的识别性能。
2、基于随机映射LSH的库搜索算法主要包括两个部分:一部分是原始 GC.MS数据映射为二进制数据,另一部分是基于二迸制数据的库搜索。实验结 果表明本算法相较于传统的质谱库搜索算法,它在搜索速度上有着明显的优势。
关键词:相似性度量;质谱库搜索;多元组合相似性度量;位置敏感哈希
万方数据
ABSTRACTA
ABSTRACT
ABSTRACT
Compound identification mainly by means of mass spectrum library similarity search.In recent years,wim the number of available mass spectrum data rapid increase in the mass spectral library,this requires a high compound identification rate, faster mass spectral library search algorithm.In this paper,a variety of similarity measure algorithms are combined and their complementarities are also used to
improve compounds identification rate,namely this al
您可能关注的文档
- 基于GA-PSO算法优化BP网络的短期电力负荷预测-计算机应用技术专业论文.docx
- 基于F类功率放大器的Outphasing发射机研究-电路与系统专业论文.docx
- 基于GA-BP神经网络的结构损伤识别研究-计算机技术专业论文.docx
- 基于GAAA算法的给水管网优化设计研究-市政工程专业论文.docx
- 基于GA-FKCN聚类的图像分割-应用数学专业论文.docx
- 基于GA-PSO优化支持向量机的漏洞分类器-计算机应用技术专业论文.docx
- 基于GaAs光导开关和火花隙的新型组合开关实验及机理分析-物理电子学专业论文.docx
- 基于FXR的蒲公英乙酸乙酯提取物利胆作用研究-中西医结合基础专业论文.docx
- 基于Gabor双弹性网格特征提取的手写体汉字识别的研究-软件工程专业论文.docx
- 基于GaBi软件的报废汽车生命周期评价研究-环境管理与经济专业论文.docx
- 基于GC-MS的烟草代谢谱分析方法研究食品科学专业论文.docx
- 基于GC-MS的代谢组学方法筛选辐射生物剂量血浆标志物的初步研究-放射医学专业论文.docx
- 基于GCC抽象语法树文本的C源程序语义分析方法研究-计算机科学与技术专业论文.docx
- 基于GCC抽象语法树文本的C源程序语义分析方法研究计算机科学与技术专业论文.docx
- 基于GCC的嵌入式系统编译器研究与开发-计算机软件与理论专业论文.docx
- 基于GCC的ARCA3的编译器移植微电子学与固体电子学专业论文.docx
- 基于GC建筑设计平台参数化设计中的算法研究-计算机应用技术专业论文.docx
- 基于Gd-DTPA的乳腺癌磁共振间质淋巴成像研究-影像医学与核医学专业论文.docx
- 基于gcg的生物信息学web系统的构建-生物医学工程专业论文.docx
- 基于gdb的嵌入式系统调试器的设计与实现-计算机应用技术专业论文.docx
原创力文档


文档评论(0)