- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Haar―like健康辨识ROC―Boosting算法应用效果研究
基于Haar―like健康辨识ROC―Boosting算法应用效果研究
摘 要:验证基于Haar-like特征的健康辨识ROC-Boosting算法在不同人群中的应用效果。在天津市南开医院采集的32例舌部图像及其健康辨识结果上运行ROC-Boosting算法,将基于Haar-like特征与其他人群采集的舌部图像及其健康辨识结果进行比较。研究结果表明,在两个人群中选择出的特征均集中于舌中、后部,基于选出特征建立的模型ROC曲线下面积达到0.864。结果验证了ROC-Boosting算法在满足人类观察舌部图像特点的同时,适用于不同人群。
关键词:舌部图像;健康状态;ROC-Boosting
DOIDOI:10.11907/rjdk.171143
中图分类号:TP319
文献标识码:A 文章编号:1672-7800(2017)007-0134-03
0 引言
Haar-like特征是用于人脸识别的一类重要特征[1]。这类特征不仅抽取速度快,而且对人脸检测等特定问题具有高敏感性或者高特异性特征。在此基础上建立的分类器,不仅准确率高,而且所选出的特征有着良好的可解释性。与应用于人脸检测相似,近年来在中医舌诊客观化研究中,也发现Haar-like特征与高尿酸血症存在联系,与疾病相关特征集中在舌部中间部分,符合中医舌诊中舌苔颜色的变化特点[2]。在此基础上,针对研究对象的健康/疾病状态使用ROC-Boosting这一算法选择出的Haar-like特征同样也集中于舌中、后部[3]。相对于特征数量,用于建立模型的数据量不足,而且医学数据获取难度大、成本高,易受到各种条件限制。因此,在当前研究阶段,无法用分类准确率等指标评价模型性能。因此,采取通过比较所选出的特征在舌部图像上的位置及所建模型ROC曲线下面积的方法,评价ROC-Boosting算法在新采集人群上的有效性。
1 对象与方法
数据采集的纳入标准为参与健康体检,年龄在20~70岁(含),且自愿参与研究的人群。因服药、外伤等导致舌部颜色、形状和纹理剧烈变化,且在1小时内无法恢复的,以及舌部活动受限的,例如流涎、无法张嘴、舌头强直、颤动等,加上不配合研究的,都予以排除。为了安抚研究对象人群,对于年龄超过范围的,也可以应邀获取图像和健康辨识结果,但其数据不参与研究。2015年9月-10月,从天津市南开医院采集了32例舌部图像,研究对象的基本情况如表1所示。采集图像后立刻由专门人员使用调查问卷将其健康状态划分为疾病和健康两类[4]。由于采集样本数量有限,将问卷中获取健康状态为可疑的,都视作疾病状态。对图像作预处理后,连同问卷健康辨识结果形成数据库,而后在其上运行ROC-Boosting算法[3]。
采用以往研究中的方法预处理采集图像,得到100*120像素的舌部图像。图1是一幅经过预处理的舌部图像。由于抽取的Haar-like特征数量较多,因而按照ROC-Boosting算法的要求过滤特征,使用t检验过滤无明显差异的特征。最终,选择p值切点为0.000 1,候选特征数为9 527。在此基础上,开始运行ROC-Boosting算法。
ROC-Boosting算法过程如下:
步骤(9)采用了两个条件,首先保证被正确分类的正类样本数和负类样本数与总体样本中正类和负类的样本数比例尽量一致。在本研究中,健康状态的样本为正类,疾病状态的为负类,这一比例为10∶22。在保证这一比例的基础上,选择ROC曲线下面积最大的特征。
使用R语言3.3.0的64位版本作为统计工具[5]。
ROC曲线下面积使用其中的ROCR包计算。特诊抽取和ROC-Boosting算法均采用R语言中的脚本完成。
2 结果与分析
2.1 结果
最终ROC-Boosting算法在现有特征集中选出了5个特征。共15个样本被正确分类后,因为没有特征满足步骤(9)的条件,算法结束。与以往研究中所选出特征的位置对比及最终模型分类的ROC曲线如图2所示。其中,图2(a)为ROC-Boosting在以往数据集上共1 322例舌部图像及其健康辨识结果上运行后,选择出的Haar-like特征的累积[3];图2(b)为在本研究中32例图像中选择出的特征的累积;图2(c)为选出这5个特征后,形成组合模型的ROC曲线,曲线下面积为0.864。
2.2 分析
从图2(b)可以看出,尽管选出的特征数量较少,但是选出特征仍旧集中在舌中部,这与在以往人群中运行ROC-Boosting算法的结果相似。一般中医认为,舌苔颜色的变化是人体健康状态的重要标志,并将舌苔颜色分为白、黄、黑等类型。已有研究对舌苔颜色及所在位置进行了研究,并认为舌苔一般位于舌中、后部[6]
原创力文档


文档评论(0)