- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于adaboost法在代谢综合征不平衡数据分类中的应用
基于AdaBoost法在代谢综合征不平衡数据分类中的应用
闫慈 田翔华 阿拉依·阿汗 张伟文 曹明芹
新疆医科大学公共卫生学院 新疆医科大学医学工程技术学院
X
关注成功!
加关注后您将方便地在 我的关注中得到本文献的被引频次变化的通知!
新浪微博
腾讯微博
人人网
开心网
豆瓣网
网易微博
摘????要:
目的 (1) 针对医疗数据不平衡的特点, 以代谢综合征为例, 通过比较单纯决策树与AdaBoost+决策树分类代谢综合征的性能, 从而确定AdaBoost+决策树在医疗不平衡数据挖掘中的优点, 为计算机辅助诊断代谢综合征提供方法学参考。 (2) 采用决策树探讨代谢综合征的影响因素。方法 采用AdaBoost平衡代谢综合征数据, 并比较数据平衡前后决策树建模的性能, 采用F-value, G-mean和AUC分析评价模型。结果 (1) 相较于单纯决策树, AdaBoost+决策树的F-value值提高6.3%, G-mean提高3.5%, AUC提高0.4%, 分别表明采用AdaBoost+决策树分类代谢综合征患者识别的性能提高6.3%, 数据整体的分类精度提高3.5%;模型的综合分类能力提高0.4%。 (2) 探讨决策树影响因素均显示:空腹血糖、高密度脂蛋白、收缩压、年龄、体重指数是代谢综合征的主要影响因素。此外, 在本研究中, 决策树提示:若FPG6.02, BMI24.99, SBP139, age≤46, 则患有代谢综合征;若FPG≤6.02, HDL-C≤0.99, BMI≤24.99, age≤61, 则不患代谢综合征。结论 采用AdaBoost+决策树的性能优于决策树, 使用决策树所得结果与相关专业研究中代谢综合征影响因素相同。
关键词:
代谢综合征; AdaBoost; 决策树; 不平衡数据集;
作者简介:闫慈 (1991-) , 女, 在读硕士, 研究方向:数据挖掘
作者简介:曹明芹, E-mail:cmq66@126.com
收稿日期:2017-03-30
基金:新疆科技支疆项目 (2016E02082)
Based on the application of AdaBoost + decision tree for metabolic syndrome with imbalanced data
YAN Ci TIAN Xiang-hua ALAYI-Ahan ZHANG Wei-wen CAO Ming-qin
School of Public Health, Xinjiang Medical University;
Abstract:
Objective ( 1) To determine the advantages of the AdaBoost + decision tree in mining unbalanced medical data by comparing the metabolic syndrome classification performance of decision tree and AdaBoost + decision tree concerning the characteristics of unbalanced medical data. So as to provide methodology reference for computer-aided diagnosis of metabolic syndrome. ( 2) To explore the influencing factors of metabolic syndrome with a decision tree. Methods The performance of the decision tree model before and after AdaBoost algorithms balancing metabolic syndrome dataset was compared. F-value, G-mean and AUC were used to analyse and evaluate the models. Results ( 1) Comparing with the decision tree, AdaBoost +decision trees F-value increased by 6. 3%, G-mean increased by 3. 5%, and AUC increased by 0. 4%, indicating that with the AdaBoost + decision tree classification th
文档评论(0)