基于模糊k最近邻规则的葛根类药材的模式识别.docVIP

  • 2
  • 0
  • 约6.33千字
  • 约 9页
  • 2021-11-26 发布于广东
  • 举报

基于模糊k最近邻规则的葛根类药材的模式识别.doc

基于模糊k最近邻规则的葛根类药材的模式识别 目录 TOC \o 1-9 \h \z \u 目录 1 正文 1 文1:基于模糊k最近邻规则的葛根类药材的模式识别 1 1 FKNN算法的原理及实现 2 2 中药葛根类药材的模式识别 3 3 结果与讨论 4 文2:基于改进K最近邻算法的中文文本分类 4 0 引 言 5 1 特征提取方法 6 参考文摘引言: 7 原创性声明(模板) 8 文章致谢(模板) 8 正文 基于模糊k最近邻规则的葛根类药材的模式识别 文1:基于模糊k最近邻规则的葛根类药材的模式识别 模式识别技术是一种借助数学方法和 计算 机技术来对样品的内部 规律 及隐含性质进行分析的综合技术,包括判别分析、聚类分析、机器学习等多种方法。该技术已经广泛应用于各个领域,随着中药 现代 化进程,该项技术逐渐在中药领域深入应用。k最近邻法已被广泛应用于模式识别的分类器设计,所谓k最近邻法(KNN)就是取未知样本的k个近邻,看这k个近邻多数属于哪一类,就把其归于哪一类,在分类过程中KNN是采用简单多数投票法来确定未知样本的分类[1]。问题是,当学习样本类别分布不均的时候,如果仅考虑排序后的k个最近邻而忽视样本间的不同距离,势必会降低KNN的分类精度[2]。模糊k最近邻算法(FuzzyKNN,FKNN)就是将模糊理论与k最近邻法相结合的一种监督学习技术,它有效解决了上述问题,它将未知样本与k个最近邻的距离模糊化,并为每个类别都设置了相应的隶属度,而不象KNN那样简单的将未知样本的归类定为“属于”或者“不属于”[3]。FKNN已被成功的应用于多个领域,在蛋白质结构预测[3]及文本分类[2]都有着不错的性能,本研究将FKNN应用于中药的模式识别,目前国内尚未见报道。 1 FKNN算法的原理及实现 本研究的FKNN算法[4]不同于聂生冬等[5]将模糊c均值聚类与KNN简单结合,而是在KNN的基础上结合模糊理论进行归类决策实现的,其具体算法安排如下: ⑴ 设已知样本集合P={p1, p, …pn},n为已知分类的样本数,c代表分类数,u代表一个c×n的矩阵; ⑵ 确定未知样本的最近邻数k的值; ⑶ 选择欧式距离范数d作为距离测度; ⑷ 对每个未知样本x: ① 计算n个距离d=d(x,pj),并对其进行排序: pi∈P,且x P d(1)≤d(2)≤d(3) ……≤d(k)≤d(k+1) ≤…≤d(n) 其中d(1)到d(k)是未知样本x的k个最近邻与x的距离。 ② 在u中找出对应于k个最近邻距离的k个列{uj},其中j=1,2, ……k。 ③ 利用上一步从u中获得的k个列{uj},计算[4] ui(x)=kj=1uij1d(x,pj)2m-1 kj=11d(x,pj)2m-1 其中m为模糊权重调节因子,对于z=1,2, …,c,如果ui(x)=max{uz(x)},z≠i,则x属于第i类。取下一个未知样本转到(4)继续,上述算法不是迭代过程,每个未知样本都必须按照上述算法处理一遍。 2 中药葛根类药材的模式识别 中药模式识别通常是根据中药所含化学成分的整体进行分类或描述,识别该中药的真伪与优劣。葛根为豆科植物野葛或甘葛藤的干燥根,全世界已知的葛属植物大约有18种,我国是葛属植物的原产地之一,分布极其广泛,葛属植物有9个种和2个变种,其中7种与药用有关,研究结果表明,不同葛属植物中药用成分异黄酮含量和组分差异显著。曾明等[7]对8个来源共17个药材样本的葛属植物的总黄酮X1、葛根素X2、大豆苷X3、大豆苷元X4、3’甲氧基葛根素X5及多糖X6,6个化学成分进行了测定[6],并测定了相应的抗内毒素活性强度,按照 文献 [8]方法对各药材的抗内毒素活性强度进行分类,强度较弱者记为1,强度较强者记为2,结果见表1。本研究运用模糊k最近邻算法以6个化学成分的含量为输入变量,药理活性强度分类为目标类别建立模式识别模型。 从表1原始数据随机选取5个作为未知数据进行测试,剩余12个作为已知数据进行学习,将各数据进行归一化处理后,运行FKNN算法,算法实现语言为MATLAB。对于FKNN,k值对分类器的性能有显著影响,表2是不同k值下FKNN的分类精度。由表2结果可见当k值大于等于7时,FKNN具有最好的分类精度,对未知数据集及整个数据集的识别正确率都达到了100%,在本例中k取7进行建模识别,识别结果见表1。我们也尝试用经典KNN法对数据进行分类,结果见表3,可见,在相同k值下FKNN都要比KNN表现出更好的分类性能。就本例数据而言,无论我们怎么调整参数,KNN法的分类精度都不能令人满意。张汉明等[8]也对同样的数据进行了Baye判别分析,结果回判的识别正确率也仅

文档评论(0)

1亿VIP精品文档

相关文档