- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质组质谱数据的断层成像模式分析.pdf
蛋白质组质谱数据的断层成像模式分析
1 1 1 2
孟辉 ,洪文学 ,宋佳霖 ,王立强
1.燕山大学电气工程学院,河北秦皇岛(066004 )
2. 燕山大学车辆与能源学院,河北秦皇岛(066004 )
E-mail :menghui_ysu@
摘 要:针对蛋白质组质谱数据分析的复杂性,提出一种断层成像原理的质谱数据模式分析
方法。该方法将多样本质谱数据三维表示,对三维数据做切分得到多个关键阈值的信息图像,
由信息图像的能量曲线构成诊断癌症的生物标记物模式模板。采用国际公开卵巢癌数据库进
行验证,敏感度为100 %,特异度为98.77 %。
关键词:蛋白质组质谱数据,三维表示,断层成像,生物标志物模式
中图分类号 TP39 文献标识码 A 国家标准学科分类与代码 120.10
1 引言
用蛋白质组质谱生物标记物模式进行癌症早期诊断是当今国际热点和前沿问题之一。近
年来,美国、英国、德国等国家的专家和学者对表面加强激光解析电离飞行时间质谱
[1-2]
(SELDI-TOF MS)技术诊断癌症进行了多方面的研究工作,取得了令人瞩目的成果 。
SELDI-TOF MS结合生物信息学方法已经成功发现了一些新的生物标记物,并达到较高的灵
[3-5]
敏度和特异度 。质谱数据呈现为一条具有很多波峰和波谷的曲线,曲线的横坐标为质核
比(m/z),单位为Dalton(Da) ,纵坐标为m/z相应分子的信号强度。利用SELDI-TOF MS进行癌
症诊断最关键的两个环节是质谱的产生与模式识别算法[6] 。应用和开发数据挖掘算法分析质
谱数据是探测能够应用于临床的生物标记物的重要步骤。Petricoin等[7]用遗传算法和自组织
聚类分析构造卵巢癌的判别模式。筛选了卵巢癌血清中5 个标记蛋白,其灵敏度达到100 % ,
[8]
特异性达到95 % ,阳性检出率达94 % 。Adam等 应用决策树算法分析前列腺癌的蛋白质组质
谱,灵敏度达到83 % ,特异性达到97 % 。大多数研究人员都是直接利用质谱仪器生产厂家提
供的分析软件(BioWizard等)进行峰值提取来发现生物标记物模式,进而进行癌症诊断。而通
常情况下峰值信息是易受干扰,且是不稳定的。
本文针对目前把质谱峰值作为分类特征情况,提出采用图像断层分析的思想对质谱数据
进行分析,形成基于断层成像原理的血清蛋白质组质谱数据癌症模式分析方法。目的在于探
索一种鲁棒性好的能发掘质谱更多信息的生物标记物模式分析新方法。
2 方法原理
本文提出方法的原理是首先将已知类别的样本作为训练数据,经预处理后表示成3维曲
面的形式,通过对曲面按不同的阈值进行断层切分,构成二值图像(阈值以上为白色,阈值
以下为黑色),再计算图像的能量曲线,构成癌症与非癌症样本的模板,作为判别的基础。
当新的样本需要判别时,按照与已知类别样本学习过程相同的方法处理,与模板进行匹配及
相似度计算,得到新样本的类别所属。原理如图1。
2.1 数据预处理
蛋白质组质谱数据库数据的预处理非常重要,直接影响图表示和分类的有效性。由于血
清内不同蛋白质丰度存在显著差异,真正对诊断疾病具有重要价值的某些蛋白质丰度往往较
低,不利于最大化其信息。本文采用归一化处理的方法对数据进行预处理。
- 1 -
已知的癌症与 未知样本
非癌症样本
您可能关注的文档
- 第三节化脓性脑膜炎.pdf
- 第二讲水文和水利计算_陈志恺.pdf
- 第八章框架剪力墙结构设计.pdf
- 第十一讲追及与相遇专题.pdf
- 等填料在弹性隔热涂料中的性能研究.pdf
- 等效电源定理的讨论.pdf
- 等离子喷涂技术及其应用.pdf
- 等离子显示器与液晶显示器的特点与发展趋势.pdf
- 等离子束表面冶金强化截齿研究.pdf
- 筒仓贮料流态的颗粒流数值模拟.pdf
- 2023年国网福建省电力有限公司高校毕业生招聘140人(第二批)笔试参考题库附带答案详解.pdf
- 2023年孝昌县顺和全过程工程咨询有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2025年中国LED发光管模块市场调查研究报告.docx
- 2023年中能建数字科技集团有限公司本部业务部门招聘笔试参考题库附带答案详解.pdf
- 2023年云南墨江投资控股集团有限公司第二批人员招聘25人笔试参考题库附带答案详解.pdf
- 2023年宁夏农垦集团招聘工作人员4名笔试参考题库附带答案详解.pdf
- 2023年中煤科工重庆设计研究院(集团)有限公司重庆中煤装饰工程公司招聘笔试参考题库附带答案详解.pdf
- 2025年中国滑动轴承滚轧器市场调查研究报告.docx
- 2025年中国针型开关市场调查研究报告.docx
- 2023年凤桥镇招聘国有企业工作人员和岗位合同人员笔试参考题库附带答案详解.pdf
文档评论(0)