- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目录
目录
II
II
HYPERLINK \l _bookmark0 4.3 系统的体系结构 40
HYPERLINK \l _bookmark1 4.3.1 系统整体结构 41
HYPERLINK \l _bookmark2 4.3.2 数据流图 46
HYPERLINK \l _bookmark3 4.4 导诊系统运行流程图 47
HYPERLINK \l _bookmark3 4.5 导诊系统运行实例 47
HYPERLINK \l _bookmark4 第五章 结束语50
HYPERLINK \l _bookmark5 参考文献51
HYPERLINK \l _bookmark6 致 谢53
HYPERLINK \l _bookmark7 附 录54
摘要
摘要
I
I
摘要
数据挖掘又称数据库中的知识发现,是从大量数据中用非平凡的方法发现有 用的知识。分类是数据挖掘中的一项非常重要的任务,在商业、金融、电讯、医 学分析、科学研究等诸多领域具有广泛的应用。统计学、机器学习、神经网络等 领域的研究者提出了很多分类方法,大部分算法是内存驻留算法,适用于小型数 据集。随着数据集的数据量和维数的增加,建立高效的、适用于大型数据集的分 类法己成为数据挖掘的一个挑战性任务。
分类是数据挖掘中一种主要的分析手段,它通过分析数据,建立分类模型,生 成分类规则,并用于分析新的数据。分类包括很多种方法如:决策树、关联规则、 贝叶斯、神经网络、遗传算法等。
C4.5 决 策 树 是 分 类 算 法 中 分 类 效 果 比 较 理 想 的 一 种 分 类 方 法 , 是 J.R.Quinlain[8]于 1993 年提出的针对 ID3 的改进算法。C4.5 决策树分类算法采用 了信息增益比作为选择测试属性的标准,弥补了 ID3 的不足,具有良好的分类效 果。
本文在 C4.5 决策树算法的基础上提出了 Boosting 集成决策树的方法有助于 提高 C4.5 决策树的分类准确率。并在多个 UCI 数据集上测试了算法,在这数十 个数据集中,Boosting 集成决策树算法都显示了极高的准确率。为导诊系统的实 现奠定了深厚的理论基础。
本文收集了大量的门诊数据,并且在数据的基础上应用了 Boosting 集成 C4.5 决策树分类器的算法,并成功完成了导诊系统的实现。经过测试和试用,本系统 完全可以对病人进行准确的分类,为病人得到准确的病症类型,得到及时的治疗。
关键词:导诊系统,数据挖掘,分类, Boosting,C4.5 决策树
II
II
ABSTRACT
Data mining could be also called Knowledge Discovery in database. It is using non-trivial methods from a large number of data to discover useful knowledge. Classification is a very important task in many fields such as the commercial, financial, telecommunications, medical analysis, and scientific research. Statistics, machine learning, neural network researchers proposed a lots of classification algorithms. But the most of the algorithm is memory algorithms, only applicable to small data sets. With the amount of data sets and the data dimension increases, to establish an efficient, large-scale data sets for classification of data mining was a challenging task.
Classification is a major analytical tool in data mining. This method is to analyze the data, then establish the classification model, and generate classification rules, and then use the classification model to analyze
您可能关注的文档
- 基于网格的任务调度算法研究-计算机应用技术专业论文.docx
- 基于随机影响的多智能体系统的一致性与同步-运筹学与控制论专业论文.docx
- 基于决策树分类算法的Web文本分类分析-计算机应用技术专业论文.docx
- 基于锁相环的CW脉冲信号接收特性研究-水声工程专业论文.docx
- 基于鱼类行为对环境因子响应关系的鱼类动态模拟-计算机应用技术专业论文.docx
- 基于内容的图形搜索平台的设计与实现-软件工程专业论文.docx
- 基于收益激励的项目进度-费用优化分析研究-管理科学与工程专业论文.docx
- 基于数字信号处理技术的智能涡街流量计设计-控制理论与控制工程专业论文.docx
- 基于物联网的农产品流通信息系统研究与设计-计算机应用技术专业论文.docx
- 基于文本挖掘方法和组分向量方法构建骨质疏松症遗传相关基因网络-应用数学专业论文.docx
- 基于无线通信的瓦斯监控系统的设计-电子与通信工程专业论文.docx
- 基于调频网络的混沌雷达信号产生-通信与信息系统专业论文.docx
- 基于误差校准技术的改进型变压器在线监测装置的研究与开发-电气工程专业论文.docx
- 基于时空联合的视频对象分割技术研究信息与通信工程专业论文.docx
- 基于物联网技术的实验室管理系统研究-电子与通信工程专业论文.docx
- 基于微博的个性化搜索系统-计算机技术专业论文.docx
- 基于适应度地形理论的作业车间调度方法研究-工业工程专业论文.docx
- 基于遥测照度控制的LED智能照明系统-光学专业论文.docx
- 基于图像的三维人体建模技术研究-精密仪器及机械专业论文.docx
- 基于深度图像的三维重建配准算法研究-计算机软件与理论专业论文.docx
原创力文档


文档评论(0)