- 2
- 0
- 约6.33千字
- 约 9页
- 2021-11-26 发布于广东
- 举报
基于模糊k最近邻规则的葛根类药材的模式识别
目录
TOC \o 1-9 \h \z \u 目录 1
正文 1
文1:基于模糊k最近邻规则的葛根类药材的模式识别 1
1 FKNN算法的原理及实现 2
2 中药葛根类药材的模式识别 3
3 结果与讨论 4
文2:基于改进K最近邻算法的中文文本分类 4
0 引 言 5
1 特征提取方法 6
参考文摘引言: 7
原创性声明(模板) 8
文章致谢(模板) 8
正文
基于模糊k最近邻规则的葛根类药材的模式识别
文1:基于模糊k最近邻规则的葛根类药材的模式识别
模式识别技术是一种借助数学方法和 计算 机技术来对样品的内部 规律 及隐含性质进行分析的综合技术,包括判别分析、聚类分析、机器学习等多种方法。该技术已经广泛应用于各个领域,随着中药 现代 化进程,该项技术逐渐在中药领域深入应用。k最近邻法已被广泛应用于模式识别的分类器设计,所谓k最近邻法(KNN)就是取未知样本的k个近邻,看这k个近邻多数属于哪一类,就把其归于哪一类,在分类过程中KNN是采用简单多数投票法来确定未知样本的分类[1]。问题是,当学习样本类别分布不均的时候,如果仅考虑排序后的k个最近邻而忽视样本间的不同距离,势必会降低KNN的分类精度[2]。模糊k最近邻算法(FuzzyKNN,FKNN)就是将模糊理论与k最近邻法相结合的一种监督学习技术,它有效解决了上述问题,它将未知样本与k个最近邻的距离模糊化,并为每个类别都设置了相应的隶属度,而不象KNN那样简单的将未知样本的归类定为“属于”或者“不属于”[3]。FKNN已被成功的应用于多个领域,在蛋白质结构预测[3]及文本分类[2]都有着不错的性能,本研究将FKNN应用于中药的模式识别,目前国内尚未见报道。
1 FKNN算法的原理及实现
本研究的FKNN算法[4]不同于聂生冬等[5]将模糊c均值聚类与KNN简单结合,而是在KNN的基础上结合模糊理论进行归类决策实现的,其具体算法安排如下:
⑴ 设已知样本集合P={p1, p, …pn},n为已知分类的样本数,c代表分类数,u代表一个c×n的矩阵;
⑵ 确定未知样本的最近邻数k的值;
⑶ 选择欧式距离范数d作为距离测度;
⑷ 对每个未知样本x:
① 计算n个距离d=d(x,pj),并对其进行排序:
pi∈P,且x P
d(1)≤d(2)≤d(3) ……≤d(k)≤d(k+1) ≤…≤d(n)
其中d(1)到d(k)是未知样本x的k个最近邻与x的距离。
② 在u中找出对应于k个最近邻距离的k个列{uj},其中j=1,2, ……k。
③ 利用上一步从u中获得的k个列{uj},计算[4]
ui(x)=kj=1uij1d(x,pj)2m-1 kj=11d(x,pj)2m-1
其中m为模糊权重调节因子,对于z=1,2, …,c,如果ui(x)=max{uz(x)},z≠i,则x属于第i类。取下一个未知样本转到(4)继续,上述算法不是迭代过程,每个未知样本都必须按照上述算法处理一遍。
2 中药葛根类药材的模式识别
中药模式识别通常是根据中药所含化学成分的整体进行分类或描述,识别该中药的真伪与优劣。葛根为豆科植物野葛或甘葛藤的干燥根,全世界已知的葛属植物大约有18种,我国是葛属植物的原产地之一,分布极其广泛,葛属植物有9个种和2个变种,其中7种与药用有关,研究结果表明,不同葛属植物中药用成分异黄酮含量和组分差异显著。曾明等[7]对8个来源共17个药材样本的葛属植物的总黄酮X1、葛根素X2、大豆苷X3、大豆苷元X4、3’甲氧基葛根素X5及多糖X6,6个化学成分进行了测定[6],并测定了相应的抗内毒素活性强度,按照 文献 [8]方法对各药材的抗内毒素活性强度进行分类,强度较弱者记为1,强度较强者记为2,结果见表1。本研究运用模糊k最近邻算法以6个化学成分的含量为输入变量,药理活性强度分类为目标类别建立模式识别模型。
从表1原始数据随机选取5个作为未知数据进行测试,剩余12个作为已知数据进行学习,将各数据进行归一化处理后,运行FKNN算法,算法实现语言为MATLAB。对于FKNN,k值对分类器的性能有显著影响,表2是不同k值下FKNN的分类精度。由表2结果可见当k值大于等于7时,FKNN具有最好的分类精度,对未知数据集及整个数据集的识别正确率都达到了100%,在本例中k取7进行建模识别,识别结果见表1。我们也尝试用经典KNN法对数据进行分类,结果见表3,可见,在相同k值下FKNN都要比KNN表现出更好的分类性能。就本例数据而言,无论我们怎么调整参数,KNN法的分类精度都不能令人满意。张汉明等[8]也对同样的数据进行了Baye判别分析,结果回判的识别正确率也仅
您可能关注的文档
- 人硒蛋白PcDNA探针的制备及其在肝脏组织中的表达.doc
- 盐酸曲马多片人体药代动力学和生物等效性.doc
- 辛伐他汀对肾移植后高脂血症患者RANTES及其受体CCR5mRNA表达的影响.doc
- 木黄酮对小鼠胰岛β细胞膜电位的影响.doc
- 魔芋超细粉末的减肥作用.doc
- 下颈椎损伤早期手术治疗55例.doc
- 矽肺模型大鼠肺间质成纤维细胞MMP.doc
- AvermectinB1a组分高产菌株的诱变育种.doc
- 来比林对抗庆大霉素耳毒性的实验.doc
- 阿洛西林钠盐的制备.doc
- 2026年重庆工贸职业技术学院单招职业技能测试模拟测试卷必考题.docx
- 2026年人工智能与教育融合:未来教育形态报告.docx
- 2026年重庆工贸职业技术学院单招职业倾向性测试模拟测试卷完美版.docx
- 2026年重庆工贸职业技术学院单招职业倾向性测试模拟测试卷参考答案.docx
- 2026年重庆工程职业技术学院单招职业适应性测试模拟测试卷学生专用.docx
- 2026年重庆工程职业技术学院单招职业适应性测试题库附答案.docx
- 2026年重庆工程职业技术学院单招职业适应性考试题库带答案.docx
- 2026年重庆工程职业技术学院单招职业适应性测试题库含答案.docx
- 2026年重庆工程职业技术学院单招职业技能考试题库及答案1套.docx
- 人教版语文三年级上册《单元整合·群文阅读》教学设计.pdf
原创力文档

文档评论(0)