基于数据挖掘技术的导诊系统的研究与实现-计算机应用专业论文.docxVIP

基于数据挖掘技术的导诊系统的研究与实现-计算机应用专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目录 目录 II II HYPERLINK \l _bookmark0 4.3 系统的体系结构 40 HYPERLINK \l _bookmark1 4.3.1 系统整体结构 41 HYPERLINK \l _bookmark2 4.3.2 数据流图 46 HYPERLINK \l _bookmark3 4.4 导诊系统运行流程图 47 HYPERLINK \l _bookmark3 4.5 导诊系统运行实例 47 HYPERLINK \l _bookmark4 第五章 结束语50 HYPERLINK \l _bookmark5 参考文献51 HYPERLINK \l _bookmark6 致 谢53 HYPERLINK \l _bookmark7 附 录54 摘要 摘要 I I 摘要 数据挖掘又称数据库中的知识发现,是从大量数据中用非平凡的方法发现有 用的知识。分类是数据挖掘中的一项非常重要的任务,在商业、金融、电讯、医 学分析、科学研究等诸多领域具有广泛的应用。统计学、机器学习、神经网络等 领域的研究者提出了很多分类方法,大部分算法是内存驻留算法,适用于小型数 据集。随着数据集的数据量和维数的增加,建立高效的、适用于大型数据集的分 类法己成为数据挖掘的一个挑战性任务。 分类是数据挖掘中一种主要的分析手段,它通过分析数据,建立分类模型,生 成分类规则,并用于分析新的数据。分类包括很多种方法如:决策树、关联规则、 贝叶斯、神经网络、遗传算法等。 C4.5 决 策 树 是 分 类 算 法 中 分 类 效 果 比 较 理 想 的 一 种 分 类 方 法 , 是 J.R.Quinlain[8]于 1993 年提出的针对 ID3 的改进算法。C4.5 决策树分类算法采用 了信息增益比作为选择测试属性的标准,弥补了 ID3 的不足,具有良好的分类效 果。 本文在 C4.5 决策树算法的基础上提出了 Boosting 集成决策树的方法有助于 提高 C4.5 决策树的分类准确率。并在多个 UCI 数据集上测试了算法,在这数十 个数据集中,Boosting 集成决策树算法都显示了极高的准确率。为导诊系统的实 现奠定了深厚的理论基础。 本文收集了大量的门诊数据,并且在数据的基础上应用了 Boosting 集成 C4.5 决策树分类器的算法,并成功完成了导诊系统的实现。经过测试和试用,本系统 完全可以对病人进行准确的分类,为病人得到准确的病症类型,得到及时的治疗。 关键词:导诊系统,数据挖掘,分类, Boosting,C4.5 决策树 II II ABSTRACT Data mining could be also called Knowledge Discovery in database. It is using non-trivial methods from a large number of data to discover useful knowledge. Classification is a very important task in many fields such as the commercial, financial, telecommunications, medical analysis, and scientific research. Statistics, machine learning, neural network researchers proposed a lots of classification algorithms. But the most of the algorithm is memory algorithms, only applicable to small data sets. With the amount of data sets and the data dimension increases, to establish an efficient, large-scale data sets for classification of data mining was a challenging task. Classification is a major analytical tool in data mining. This method is to analyze the data, then establish the classification model, and generate classification rules, and then use the classification model to analyze

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档