基于决策树和面向对象技术的糖尿病诊断专家系统设计.pdf

基于决策树和面向对象技术的糖尿病诊断专家系统设计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于决策树和面向对象技术的糖尿病诊断专家系统设计.pdf

第 l期 倪家远,等:基于决策树和面向对象技术的糖尿病诊断专家系统设计 7l 内存 ,系统通过与用户对话,推导出患者所患的疾病名称 ,然后系统将与疾病有关的决策树调入内存。这样 不仅可以运行知识量大的决策树,而且减小了搜索空间,提高了推理效率用。知识库还有一个重要功能是把 用 自然语言表示的糖尿病知识转化为计算机可识别的形式化知识。(2)综合数据库:在问题求解过程中会产 生各种中间性临时性的数据 ,这些数据放在综合数据库中8[1。该系统中综合数据库用于记录用户所描述的病 情、化验结果、推理的中间结果和最终结论等。(3)推理机 :是专家系统的 “大脑”,它在一定的控制策略下模 拟糖尿病医疗专家的思维过程 ,结合综合数据库中的已知事实,选取知识库中相应的决策树,通过遍历决策 树匹配 已知当前事实知识和规则。该系统基于决策树采用正向推理,即数据驱动推理方法,从患者的症状、 并发症及相关检测化验数据出发推出诊断结果。(4)知识获取机制:从知识源 中对杂乱无序的糖尿病知识进 行识别和选取,将其转换成计算机可识别的形式,并不断完善知识库。知识源包括医疗专家知识、经验和相 关专业书籍知识。知识获取系统由建立系统的知识工程师所使用,当发现有知识被遗漏或不完善时,知识工 程师可以利用这个机制来增加和修改知识 。(5)解释程序 :是对系统的推理过程作出通俗易懂的解释 ,以增 加推理过程 的可信度。该系统采用路径追踪法,即对系统求解过程的推理路径和知识库的运行状态信息进 行重显。(6)人机接 口:即人机界面 ,是人机交流的桥梁 ,用户通过人机界面输人糖尿病专家系统所需的数据 和信息,系统通过人机界面显示结果和相关解释信息。 2 系统的具体设计 2.1 建立决策树 2.1.1 决策树学习算法 知识工程师从医疗专家处获得的案例、知识、经验是零碎无序的,决策树经过归纳 学习建立起构造有序的树型结构,一方面可以使凌乱的知识有序化,另一方面在建立起决策树的同时也使各 知识点的逻辑关系更明确化,这样更有利于决策树的推理。 构造决策树的关键是选择合适的属性和确定节点的划分规则。由于 ID3算法是决策树学习中较为流行 的算法,在此采用该算法,通过学习,自上而下地构造决策树。在决策树的构造过程中,首先计算每个属性分 类训练样例的能力,这样就量化 了属性的分类能力,然后选择分类能力最佳的属性作为根节点的测试属性 。 接着根据根节点属性值的个数产生同等数量的分支,然后把具有相同属性值的样例安排在相应的分支下。 重复执行这样一个过程 。在每个新的分支下排放的实例 中选择分类能力最强的属性作为新节点的测试属性。 结束整个过程执行的条件有两个 :(1)所有训练样例都被归为同一类,(2)没有剩余属性可使用。对于缺少属 性的训练样例 ,可以把该节点的训练样例 中该属性最常见的值赋给它。 ID3算法的核心是确定何种属性作为建树过程中节点的测试属性。在此引出信息增益的概念。信息增 益:在某一个操作之前的系统熵与操作之后的系统熵的差值,也即是不确定性的减少量。信息的增加意味着 不确定性的减少,也就是熵的减小。熵是描述事物无序性的参数,熵越大则无序性越强,在信息领域定义为 熵越大 ,不确定性越大 。 设有 C个不同类的样例集 S.则熵的定义为 C 1 Entropy(S)=- Pilog2Pi (1) i=1 其中, 是样例集 Js中任意样例属于类别 i的比例 。 一 个属性A相对样例集合S的信息增益 Gain(S,A)可定义为 lc I Gain(S,A)=Entropy(S.)一 j Entropy() (2) 口EValues(A) IL】 I 其 中,Values(A)是属性A所有可能值的集合, 是 S中属性A 的值为 的子集,即 = ∈SIA(s)V}。上 式值越大说明选择属性A对于分类提供的信息越大。ID3算法在建

文档评论(0)

170****0532 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8015033021000003

1亿VIP精品文档

相关文档