以生物质特性预测木质纤维素酶系组成的研究.pdfVIP

  • 0
  • 0
  • 约8.17万字
  • 约 58页
  • 2026-03-16 发布于江西
  • 举报

以生物质特性预测木质纤维素酶系组成的研究.pdf

摘要

木质纤维素生物质广泛存在于各类农业副产物中,其高值化利用对于实现我国的

可持续发展来说至关重要,可是木质纤维素的复杂结构阻碍了它的降解转化。使用纤

维素酶制剂降解木质纤维素生物质是一种高效且环保的方法,然而单一的酶对于木质

纤维素的降解效果相当有限,必须通过复合酶系才能取得较好的降解效果。在先前的

研究中,从多种酶的复配组合中找出最优的组合的方法主要是通过大量湿实验进行试

错,其最明显的缺点是费时费力且成本高昂。本文通过几种关键技术,搭建了一个神

经网络模型EA-net,并采用无监督学习方法,从77种木质纤维素生物质底物特征和

30种酶系组合特征数据出发,在包含2310个样本的数据集中进行学习。以高效低成

本的方式寻找匹配特定底物最优酶系的组合,实现多种秸秆类木质纤维素资源的高效

转化。

EA-net神经网络模型包含嵌入操作和注意力机制。在搭建过程中,通过使用嵌入

操作来扩维数据,充分理解酶系组合数据的性质。两次注意力机制可以从大量的数据

信息中获取注意力,用于找出生物质底物两类特征数据以及生物质底物与酶系组合数

据之间的非线性关系。EA-net模型的训练采用无监督的对比学习方法,这使得网络模

型能够学习样本间的异同,从而丢弃无用的特征保留有用的特征。生物质-酶的混合物

组合在不同角度都具有一定的相似性,采用多聚类策略可以将它们按不同的类别进行

聚集,以拒绝一些有争议的子样本为代价,识别出更高纯度的组合。

基于对四种生物质底物的高分类组合预测结果,进行了湿实验验证,预测的酶系

组合在固态发酵体系中表现的相较于目前的研究报道更优秀,粗蛋白质平均提升量达

到220.33%,要比以往研究报道高出两倍以上。本方法利用生物质材料简单的的表征

数据和酶系组合作为输入,且不需要预先标记数据集,其对高分类组合的预测精确度

(91.98%)仍然优于传统的的监督学习方法。不论是使用不同的替代方法学习这个包

含2310个样本的原始数据集,还是使用本文提出的方法在不同的子样本数据集上进

行学习,基于EA-net模型的无监督学习方法都展现出了对原始数据集更高的学习性

能。同时,开发了一种基于EA-net模型的监督学习方法,并将其预测结果的稳定性

和精确度与一些经典机器学习算法进行比较,证明了EA-net模型的高鲁棒性和有效

性。

对于木质纤维素生物质高值化利用的研究中,本文提出了一种与深度学习结合的

创新方法,摆脱了通过湿实验盲目试错的过程,为找寻降解木质纤维素生物质的最优

酶系组合提供了更有效简单的方式。通过提高木质纤维素生物质向可发酵糖的转化效

率,可以更好的实现农业副产物的高值化应用。与此同时,这一突破为生物质生物精

炼过程中更广泛地采用深度学习技术开辟了新的可能性,从而促进生物质生物精炼的

创新和进步。

关键词:木质纤维素;复合酶系;无监督学习;EA-net模型

ABSTRACT

Lignocellulosicbiomassiswidelyusedinallkindsofagriculturalby-products,andits

high-valueutilizationisveryimportanttoachievethesustainabledevelopmentofour

country,butthecomplexstructureoflignocellulosicbiomasspreventsitsdegradationand

transformation.Theuseofcellulasetodegradelignocellulosicbiomassisanefficientand

environmentallyfriendlymethod.However,thedegradationeffectofasingleenzymeis

quitelimited,andbetterdegradationeffectmustbeachievedthroughacomplexenzyme

system.Inpreviousstudies,themethodtofindtheoptimalcombinationfromthe

combinationofmultipleenzymesmainlyin

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档