- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于决策树和面向对象技术的糖尿病诊断专家系统设计.pdf
第 l期 倪家远,等:基于决策树和面向对象技术的糖尿病诊断专家系统设计 7l
内存 ,系统通过与用户对话,推导出患者所患的疾病名称 ,然后系统将与疾病有关的决策树调入内存。这样
不仅可以运行知识量大的决策树,而且减小了搜索空间,提高了推理效率用。知识库还有一个重要功能是把
用 自然语言表示的糖尿病知识转化为计算机可识别的形式化知识。(2)综合数据库:在问题求解过程中会产
生各种中间性临时性的数据 ,这些数据放在综合数据库中8[1。该系统中综合数据库用于记录用户所描述的病
情、化验结果、推理的中间结果和最终结论等。(3)推理机 :是专家系统的 “大脑”,它在一定的控制策略下模
拟糖尿病医疗专家的思维过程 ,结合综合数据库中的已知事实,选取知识库中相应的决策树,通过遍历决策
树匹配 已知当前事实知识和规则。该系统基于决策树采用正向推理,即数据驱动推理方法,从患者的症状、
并发症及相关检测化验数据出发推出诊断结果。(4)知识获取机制:从知识源 中对杂乱无序的糖尿病知识进
行识别和选取,将其转换成计算机可识别的形式,并不断完善知识库。知识源包括医疗专家知识、经验和相
关专业书籍知识。知识获取系统由建立系统的知识工程师所使用,当发现有知识被遗漏或不完善时,知识工
程师可以利用这个机制来增加和修改知识 。(5)解释程序 :是对系统的推理过程作出通俗易懂的解释 ,以增
加推理过程 的可信度。该系统采用路径追踪法,即对系统求解过程的推理路径和知识库的运行状态信息进
行重显。(6)人机接 口:即人机界面 ,是人机交流的桥梁 ,用户通过人机界面输人糖尿病专家系统所需的数据
和信息,系统通过人机界面显示结果和相关解释信息。
2 系统的具体设计
2.1 建立决策树
2.1.1 决策树学习算法 知识工程师从医疗专家处获得的案例、知识、经验是零碎无序的,决策树经过归纳
学习建立起构造有序的树型结构,一方面可以使凌乱的知识有序化,另一方面在建立起决策树的同时也使各
知识点的逻辑关系更明确化,这样更有利于决策树的推理。
构造决策树的关键是选择合适的属性和确定节点的划分规则。由于 ID3算法是决策树学习中较为流行
的算法,在此采用该算法,通过学习,自上而下地构造决策树。在决策树的构造过程中,首先计算每个属性分
类训练样例的能力,这样就量化 了属性的分类能力,然后选择分类能力最佳的属性作为根节点的测试属性 。
接着根据根节点属性值的个数产生同等数量的分支,然后把具有相同属性值的样例安排在相应的分支下。
重复执行这样一个过程 。在每个新的分支下排放的实例 中选择分类能力最强的属性作为新节点的测试属性。
结束整个过程执行的条件有两个 :(1)所有训练样例都被归为同一类,(2)没有剩余属性可使用。对于缺少属
性的训练样例 ,可以把该节点的训练样例 中该属性最常见的值赋给它。
ID3算法的核心是确定何种属性作为建树过程中节点的测试属性。在此引出信息增益的概念。信息增
益:在某一个操作之前的系统熵与操作之后的系统熵的差值,也即是不确定性的减少量。信息的增加意味着
不确定性的减少,也就是熵的减小。熵是描述事物无序性的参数,熵越大则无序性越强,在信息领域定义为
熵越大 ,不确定性越大 。
设有 C个不同类的样例集 S.则熵的定义为
C
1
Entropy(S)=- Pilog2Pi (1)
i=1
其中, 是样例集 Js中任意样例属于类别 i的比例 。
一 个属性A相对样例集合S的信息增益 Gain(S,A)可定义为
lc I
Gain(S,A)=Entropy(S.)一 j Entropy() (2)
口EValues(A) IL】 I
其 中,Values(A)是属性A所有可能值的集合, 是 S中属性A 的值为 的子集,即 = ∈SIA(s)V}。上
式值越大说明选择属性A对于分类提供的信息越大。ID3算法在建
您可能关注的文档
- 基于ReliefF和PSO混合特征选择的面向对象土地利用分类.pdf
- 基于Rough集的关键词集约简.pdf
- 基于SDN控制器的关键技术在IP网络流量调优的可行性研究.pdf
- 基于SharePoint客户端对象模型的文档库元数据处理.pdf
- 基于SimMechanics的工业机器人工作空间关键技术研究.pdf
- 基于Snake和外观模板的组合式图像对象分割.pdf
- 基于SolidWorks和Ansys Workbench的钢管输送机构关键部件的优化设计.pdf
- 基于TOE&RC框架的企业采纳BIM关键性因素研究.pdf
- 基于WEBGIS的数字林业管理平台关键技术及其应用研究.pdf
- 基于WebGIS的水环境模拟关键技术研究.pdf
最近下载
- 综合交通运输与智能交通重点专项实施方案1.0-提交综合处版.pdf VIP
- 工程交接记录.docx VIP
- 2023年四川省公需科目(数字经济与驱动发展)考试题库及答案.docx
- 变形缝安装施工方案.docx VIP
- 2025年最新版个人征信报告(含水印)模板【可修改】 .pdf VIP
- 爱登堡电气原理图及代号说明EDVF23.pdf VIP
- 20240412-西部证券-爱柯迪-600933-首次覆盖报告:新能源中大件扩张周期,全球化战略开启新篇章.pdf VIP
- 物联网技术与应用(高职物联网相关专业)PPT完整全套教学课件.pptx VIP
- 热烈庆祝八一建军节建军98周年专题.pptx VIP
- 卫生监督协管试题库.pdf VIP
文档评论(0)