决策树算法在老年性痴呆病因病机分析中的应用.pdfVIP

  • 0
  • 0
  • 约9.55千字
  • 约 2页
  • 2026-01-21 发布于江西
  • 举报

决策树算法在老年性痴呆病因病机分析中的应用.pdf

I..学变………一

决策树算法在老年性痴呆病因病机分析中的应用

山西中医学院医药管理学院杨婕

【摘要】通过决策树算法建立了老年性痴呆病型病因判断模型。文中详细研究了决策捌算法C50及其修正方法,之后通过对太原市1500例数据的分析借助决策树C50算

法构建了老年性痴呆的判断模型,并对其进行了修正,得到具有实际指导意义的

【关键词】决策树;C5.0算法;老年性痴呆

Abstract:Euolo~c1udgwnentmodelofAlzheimer。Sdiseasewasestablishedbythedecisiontreealgorithm1’hispaperstudiedindet~lthedecisiontreealgorithm(:50anditscorrection

method1500casesofdataofTaiyuanwereanalyzedbymeansofdecisiontreeC50algorithmandtheJudgmacntmodelofAlzheimer’Sdiseasewashtenestab~shedandcorrectedThe

Judgmentmodelwithpracticalsignificancewasobtmned

Keywords:decisiontree;C50algorihtm;alzheimerSdisease

老年性痴呆,又叫阿尔茨海默病(A1z

Ent(UI,)【∑P(V)P(f【f)log2一=,)(’~P(“)10g2,)(“jV,)

heimer’SDisease,AD)是一种多发于老年,kui{Ji

人的神经退行性疾病,临床特征主要有知功C5.0根据能够带来最大信息增益的字段拆分样本。第一次拆分确定的样本子集随后再

能障碍和记忆损害。据报道,老年期痴呆中根据另一个字段进行拆分,直到样本子集不能再拆分为止。最后检验最低层次的拆分,采

AD是全世界最致残和最累赘的疾病之一…,用后修剪法从叶节点向上逐层判断错误率,剔除或者修建对没有显著贡献的样本子集。

除了脊髓损伤和晚期癌症以外,AD致残加权2.基于决策树05.0算法的老年性痴呆病因病机预测模型

显著高于任何其他健康情况,但目前为止2.1数据收集

AD的早期防治却难以落实。这主要是因为其本文采用流行学的方法在太原市迎泽区、万柏林区、杏花岭区三个市区的医院和社

发病的特殊性,且存在地域性差异,而以往保中心进行调查,收集共计1500条有效信息作为数据集合。其中每条记录由23个字段组

研究又缺乏对AD证候类型、汪候诊断的统一成。其中前22个字段是对调研者信息的描述,包括:id、性别、年龄、民族、职业、文化

标准,所以想要研究AD的病因和发病机制就程度、婚姻状况、居住方式、饮食偏嗜、是否饮酒、是否吸烟、是否痴呆、有无脑血管意

颇有难度。外、有无帕金森病、有无精神疾患、有无心血管疾病、有无神经系统疾病、有无呼吸系统

如何对AD的中医病因进行科学分类和疾病、有无消化系统疾病、有无内分泌系统疾病、有无血液系统疾病、有无其他系统疾

识别,进而总结提炼归类出可疑痴呆及确诊病。最后一个字段是对调研者是否患病的判断,分为:“老年性痴呆(AD)”、“血箭性痴

痴呆各自不同期的中医病机演化规律、致病呆(VD)”、“混合型痴呆(MD)”和“未患病”四个类别。我们对前22字段进行丫分炎,如

危险因素以及证候类型的分布规律,已成为表1所示。

AD的有效防治迫切需要解决的问题。这22个字段是除了id字段,其他都是现代医学的高危因素。在模型建立初期,我们先

本文的主要工作就是深入研究决策树将其都纳入分析体系中,作为输入变量。

C5.0算法,并利用太原市迎泽区、万柏林表1样本宇段分类

区、杏花岭区三个市区共计1500条数据

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档