基于随机森林算法的糖尿病预测研究.pdfVIP

基于随机森林算法的糖尿病预测研究.pdf

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

医学信息学杂志2019年第40卷第9期JOURNALOFMEDICALINFORMATICS2019,Vol.40,No.9

基于随机森林算法的糖尿病预测研究

杨美洁唐建军

(重庆医科大学医学信息学院重庆400016)

〔摘要〕采用随机森林算法建立糖尿病预测模型,介绍数据建模与评估步骤和方法、选择标准。以受试者

工作特征曲线的曲线下面积、灵敏度、特异性、正确率等指标评价模型的预测效果,结果表明随机森林预

测模型对糖尿病具有较强的预测能力。

〔关键词〕随机森林;糖尿病;灵敏度;特异性;AUC

〔中图分类号〕R-056〔文献标识码〕A〔DOI〕103969/jissn1673-6036201909011

StudyonPredictionsofDiabetesMellitusBasedonRandomForestAlgorithmYANGMeijie,TANGJianjun,MedicalInformatics

College,ChongqingMedicalUniversity,Chongqing400016,China

〔Abstract〕Thepredictionmodelsofdiabetesmellitushasbeenbuiltbytakingrandomforestalgorithm.Thepaperintroducesdata

modeling,stepsandmethodsofevaluation,selectioncriteria,andevaluatesthepredictiveeffectofthemodelsusingindicatorsofthearea

undercurveofreceiveroperatingcharacteristiccurve,sensitivity,specificity,accuracy,etc.Theresultindicatesthattherandomforest

predictionmodelpossessesarelativestrongpredictionabilityasfordiabetesmellitus.

〔Keywords〕randomforest;diabetesmellitus;sensitivity;specificity;AUC

[2]

清楚。近年来国内的学者根据糖尿病的致病因素

1引言开始构建疾病风险预测模型。陈松景等利用反向传

播神经网络的患病因素对血糖影响的量化进行分

糖尿病是由于机体不正确产生或使用胰岛素而析,筛选出性别、体重等10个因素,该方法可推

[3]

引起蛋白质、脂肪、糖等物质在血液、肝脏等器官广到其他疾病危险因素的量化分析。郭奕瑞等利

[1]

中代谢紊乱的疾病。据国际糖尿病联盟统计,用神经网络和Logistic回归算法建立2型糖尿病的

2017年大约425亿成年人(20~79岁)患有糖尿预测模型,使用ROC曲线来评估模型,得出神经网

病,到2045年糖尿病成年人患者将增加到629亿。络模型较Logisti回归模型具有更好的预测效果的结

作为3大健康杀手之首的糖尿病,全球的发病率在[4]

论。王勋等采用不同核函数的支持向量机对2型

逐年上升。目前国内未有系统的糖尿病风险预测模糖尿病的患病风险进行预测,认为径向基核函数支

型及统一的致病因素,其发病机制和发病机理尚不持向量机模型的预测效果最佳[5]。余丽玲等根据最

文档评论(0)

朝兵 + 关注
实名认证
文档贡献者

原版文件原创

1亿VIP精品文档

相关文档