一种基于Cycle-GAN的蛋白质结构预测方法及装置发明专利.docxVIP

一种基于Cycle-GAN的蛋白质结构预测方法及装置发明专利.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于Cycle-GAN的蛋白质结构预测方法及装置 技术领域 本发明涉及生物信息和深度学习领域,尤其涉及一种基于Cycle-GAN的蛋白质结构预测方法及装置。 背景技术 目前,蛋白质三维结构测定的实验手段有X-射线晶体学、核磁共振(NMR)和近几年兴起的冷冻电镜技术。但X-射线晶体学需要蛋白质分离提纯并结晶,只能测定单晶,反映静态结构信息,无法测定溶液中的信息。对一些柔性的、结构复杂的生物大分子蛋白质来说,比较难以得到所需的晶体结构。核磁共振方法无需结晶,可以在液体状态测出三维结构,但分辨率不高,目前NMR只能用于测定小分子和中型蛋白质的结构。 冷冻电镜(Cryo-Electron Microscopy,Cryo-EM)技术,利用快速冷冻技术对样品进行冷冻固定,对样品进行电子成像,利用高灵敏底片进行成像记录,利用扫描仪对底片进行数字化,对数字化的图像进行二维图像处理,完成样品的三维重构计算。冷冻电镜技术可以解析出不适合应用X射线晶体学和核磁共振技术进行分析的样品,如难以结晶的膜蛋白、大分子复合体等,并能捕捉动态结构变化信息。冷冻电镜技术没有结晶和长度限制,是蛋白质结构解析最有前途的技术,但缺点是实验设备和实验成本过于高昂。 图像融合(Image Fusion)是指将多源信道所采集到的关于同一目标的图像数据经过图像处理和计算机技术等,最大限度的提取各自信道中的有利信息,最后综合成高质量的图像,提升原始图像的空间分辨率和光谱分辨率。 Cycle-GAN(Cycle-Consistent Generative Adversarial Networks,循环一致性生成对抗网络)是朱俊彦等人在2017年在arxiv上发表的一篇关于图片风格迁移的论文(ZHU J Y,PARK T,ISOLA P,etal.UnpairedImage-to-image Translation UsingCycle-Consistent Adversarial Networks[EB/OL].[2017-03-30]./pdf/1703.10593.pdf)。 发明内容 本发明为提高传统X射线晶体学或核磁共振检测的蛋白质图像分辨率,同时在一定程度上减少冷冻电镜的使用,在本发明的第一方面提供了一种基于Cycle-GAN的蛋白质结构预测方法,包括如下步骤:获取多个蛋白质的X射线晶体衍射图像、核磁共振图像和冷冻电镜图像,记X射线晶体衍射图像为第一图像、核磁共振图像为第二图像;将所述冷冻电镜图像进行有监督数据增强,所述有监督数据增强包括单样本增强、多样本增强;将与冷冻电镜图像属于相同蛋白质的第一图像或第二图像作为正样本,剩下的第一图像或第二图像作为负样本;将正样本对应的冷冻电镜图像作为目标标签;根据正样本、负样本和目标标签构建模型数据集;将所述模型数据集划分为训练集、验证集和测试集,利用所述模型数据集对Cycle-GAN进行训练直至其损失函数值低于阈值且不再变化,停止训练,得到训练完成的Cycle-GAN;将待预测蛋白质结构的第一图像或第二图像输入到所述训练完成的Cycle-GAN,得到对应的冷冻电镜图像;将所述对应的冷冻电镜图像进行滤波去噪、融合和三维重构,得到待预测蛋白质的三维图像。 在本发明的一些实施例中,所述将所述冷冻电镜图像进行有监督数据增强包括如下步骤:若蛋白质对应的冷冻电镜图像数量为1,则对所述冷冻电镜图像进行单样本增强;所述单样本增强包括几何变换、颜色变换;若蛋白质对应的冷冻电镜图像数量大于1,则对所述冷冻电镜图像进行多样本增强。进一步的,所述几何变换至少包括对图像的翻转、旋转、剪裁、变形、缩放中的一种;所述颜色变换至少包括对图像的内容进行模糊、擦除、填充、噪声叠加、颜色更换中的一种。 在本发明的一些实施例中,所述Cycle-GAN包括第一Cycle-GAN、第二Cycle-GAN,所述第一Cycle-GAN包括第一生成器、第一判别器、第一重构生成器、第一重构判别器,所述第二Cycle-GAN包括第二生成器、第二判别器、第二重构生成器、第二重构判别器;所述第一生成器,用于根据X射线晶体衍射图像生成对应的冷冻电镜图像;所述第一判别器,用于判断所述第一生成器生成的冷冻电镜图像的真实性;第一重构生成器,用于根据冷冻电镜图像生成对应的X射线晶体衍射图像、第一重构判别器用于判断所述第一重构生成器生成的X射线晶体衍射图像的真实性;所述第二生成器,用于根据核磁共振图像生成对应的冷冻电镜图像;所述第二判别器,用于判断所述第二生成器生成的冷冻电镜图像的真实性;第二重构生成器,用于根据冷冻电镜图像生成对应的核磁共振图像,第二重构判别器用于判断所述第二重构生成器生成的核磁共振图像的真实性。 参考图2,进一步的,所述第一Cycle-GAN的损失函数为: L(G,F,P?x

文档评论(0)

Ksec小七 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档