基于毛细管电泳指纹图谱的连钱草中有效成分含量预测.docxVIP

下载本文档

0
0
约5.02千字
约 5页
2023-09-04 发布于广东
举报
版权申诉

基于毛细管电泳指纹图谱的连钱草中有效成分含量预测.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于毛细管电泳指纹图谱的连钱草中有效成分含量预测连草是属于嘴唇科的血毒症（nakai）的干燥部位。具有润湿、解毒、祛瘀、消肿的功效。用于热侵、石雨、湿热黄疸、伤口、肿胀和其他损伤。人工神经网络(Artificial Neural Network,ANN)是一种对复杂非线性关系进行预测的化学计量学方法,也是近年来中药领域研究的热点,它对中药指纹图谱的确定性与模糊性具有很好的适应能力,在复杂关系问题的建模上尤显其独特的优势。ANN在中药领域的应用越来越多,如:乔延江等在蟾酥质量的模式识别,刘红梅在白芷超临界萃取,以及宋小莉等在半夏泻心汤配伍研究中均采用了ANN的手段并取得较好的效果。但以指纹图谱作为神经网络输入进行特定组分含量预测的研究尚未见报道。本文以不同产地或批次连钱草的毛细管电泳(Capillary Electrophoresis,CE)指纹图谱数据及总黄酮和三萜酸类成分的含量为训练样本集,构建反向传播神经网络(Back-Propagation Neural Network,BPNN)、径向基函数神经网络(Radial Basis Function Neural Network,RBFNN) 和广义回归神经网络(Generalized Regression Neural Network,GRNN)三种ANN 模型,用于预测未知连钱草样本的总黄酮和三萜酸类成分的含量,为中药化学成分的定量研究提供一种新方法。 1 样本数据 1.1 相对峰面积归一化连钱草来源于湖北省七个不同产地或批次,CE指纹图谱见图1。对CE指纹图谱进行如下数据化处理(方法与文献不同):将迁移时间进行多峰参比校正(即选择谱图中5个分散分布的共有峰,以其迁移时间之和为参比进行校正),得到相对迁移时间并据此进行共有峰确认,保留部分非共有峰(舍去指纹图谱中相对峰面积小于0.3%的非共有峰),扣除加入的芦丁内标峰,然后进行峰面积归一化,得到的相对峰面积即为ANN所需的输入数据。为了给数据加入一定的随机误差,减少网络中误差的影响,对同一产地或批次的连钱草每重复测定一次指纹图谱,即计为一个样本,共得到17个样本(见图2注)。 1.2 各因子2的含量七个不同产地或批次连钱草的总黄酮和三萜酸类成分的含量都来源于文献,见表1。两者的含量在数值上相差很大,为了减小对网络的影响,将它们除以各自的平均值,使数据都更接近于1。这样处理得到的数据即为ANN所需的目标输出数据,对来源于相同产地或批次的连钱草样本,目标输出数据相同。 1.3 聚类分析方法聚类分析是根据指标间的相关性或样品间的相似性对指标或样品进行归类的一种分析方法,是一种常用的对类似样本进行相关性比较的手段。本实验采用Matlab7.04软件,按照欧氏距离分别计算输入数据、输出数据的距离,并分别以平均距离法和最短距离法将17个样本进行聚类,结果如图2、图3所示。除了进行聚类分析外,还分别采用相关系数法和夹角余弦法对连钱草CE指纹图谱进行常规的相似度计算,两种方法都以17个样本的平均值作为参照对象,结果见表2。 2 la7.4编写建立网络模型所需的程序采用Matlab7.04编写。调用该软件神经网络工具箱中的相应函数进行编程,并以网络预测误差评价网络模型的性能。 2.1 算法及算法优化 BPNN是具有多层结构的误差逆传播网络,它有一个输入层,一个或多个隐藏层以及一个输出层。网络建立:网络结构为32-7-3-2,即含有32个神经元的输入层、两个分别含有7个神经元和3个神经元的隐藏层以及含有2个神经元的输出层。输入层32个神经元对应指纹图谱上认定的32个峰(输入数据),输出层2个神经元对应总黄酮和三萜酸类成分的含量(目标输出数据)。隐藏层用的传输函数分别为logsig和tansig函数,输出层调用了purelin函数。网络的拓扑结构以及其中采用的传输函数直接关系到模型的性能,当隐藏层只有一层时,无论其传输函数为tansig还是logsig,通过改变其隐藏层神经元个数,所得到的误差大都在30%以上;而采用两个隐藏层,通过改变传输函数的组合(logsig-tansig)以及两个隐藏层的神经元个数,可以得到一个最小的误差点。训练方法:考察了动量BP算法、学习率可变的BP算法、弹性BP算法、四种变梯度算法、两种拟牛顿算法以及L-M优化算法。综合考虑训练速度、预测误差以及预测的可重复性,弹性BP算法应是最佳的选择。弹性BP算法的一大优点是能够在网络误差的下降梯度小于预设值时停止训练,这使得网络收敛迅速,又不至过度训练,从而保证了误差的稳定性。学习率和网络训练目标也是BP网训练的两个关键性参数,以预测误差的平方和为优化指标,考察不同学习率与网络训练目标的组合,得出最佳组合为:学习率0.008,网络训练目标10-3。