- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
致
谢
在 我 的 硕 士 论 文 完 成 之 际 ,回 首 攻 读 硕 士 研 究 生 期 间 的 学 习 和 生 活 ,感 觉
自 己 受 益 良 多 ,自 己 的 能 力 有 很 大 的 提 高 ,这 三 年 的 时 间 ,受 到 了 许 多 人 的 帮
助,在此像他们表示由衷的感谢。
首 先 ,我 要 衷 心 感 谢 我 的 导 师 邢 长 征 教 授 ,在 整 个 学 习 过 程 中 ,提 供 给 我
许 许 多 多 能 终 身 受 益 的 锻 炼 的 机 会 。整 个 的 攻 读 过 程 ,每 一 个 环 节 都 倾 注 了 老
师 的 汗 水 和 心 血 。同 时 老 师 严 谨 的 作 风 、优 异 的 领 导 才 能 、远 见 的 卓 识 令 人 钦
佩 ,相 信 ,从 老 师 身 上 学 到 的 这 一 切 ,将 在 我 日 后 的 学 习 生 活 工 作 中 发 挥 巨 大
的作用。
其次,感谢电信学院所有曾经辛勤培养、关心、支持我的老师们,尤其要
感谢关欣老师,是他们在学习和生活上给了我很大的帮助。
感 谢 同 门 的 师 兄 弟 姐 妹 们 一 直 给 予 我 的 鼓 励 与 支 持 ,感 谢 那 些 素 不 相 识 文
献工作者,是他们的不倦的工作奠定了我论文的基础。
感谢我的同学、朋友们一直以来对我的照顾和支持。
感 谢 我 的 家 人 ,是 他 们 长 期 以 来 在 生 活 和 精 神 上 给 我 巨 大 的 支 持 ,他 们 的
支持一直是我前进的动力。
最后再一次向所有的关心、爱护和帮助我的人们致以最衷心的感谢。
摘
要
决策树算法在数据挖掘技术中有重要的作用,本文着重研究了决策树理论中的
C4.5 算法,针对其在 当 训 练 集 样 本 包 含 大 量 的 连 续 值 属 性 时 , 算 法 将 会 效 率 低
下 的 缺 点 ,提 出 了 利 用 划 分 熵 取 得 最 小 值 的 改 进 方 法 ,得 出 对 连 续 值 属 性 离 散
化 处 理 时 ,只 需 对 其 其 边 界 点 进 行 计 算 ,降 低 连 续 值 属 性 离 散 化 的 时 间 复 杂 度 。
同时对求解信息增益率的公式进行了简化。本文改进了一种决策树的简化模
型 。 使 之 能 利 用 信 息 增 益 度 量 选 择 测 试 属 性 ,得 到 最 为 合 理 的 测 试 属 性 ,也 使 得
属 性 选 择 度 量 的 信 息 理 论 含 义 清 晰 ,可 解 释 性 明 确 。本 文 设 计 实 现 了 一 个 学 生 成
绩 预 测 系 统 ,以 C 语 言 典 型 课 程 为 例 ,挖 掘 该 课 程 成 绩 与 哪 些 因 素 相 关 ,哪 些
是决定性因素,使教师针对不同类型的学生采用不同的教学方法和教学侧重
点,提高该课程成绩。
关键词:决策树; C4.5;离散化
- I -
Abstract
Decision tree algorithm plays an important role in data mining.It studies an
important algorithm named C4.5 in this paper, For the samples in the training set
contains a large number of continuous-valued attribute,algorithm will be inefficient.It
proposed an improved method of obtaining the minimum entropy,derived for
continuous-valued attribute discretization processing.And the best demarcation point is
at the border point.So It can reduce the continuous-calued attributes and the time
complexity
of
discretization.At
the
same
time,it
comprises
information
gain
formula.The
complex
decision
tree
does
not
understand
and
build
for
the
policymakers.This paper presents a simplified model of the decision tree.So that it can
use i
您可能关注的文档
- 社区体育服务居民满意度测评的研析.doc
- 射干麻黄柴胡颗粒治疗小儿喘息性支气管炎寒热错杂哮证的临床研析.doc
- 涉检视野下未成年人刑事和解制度的构建_论文.doc
- 涉外药品责任的法律适用_论文.doc
- 麝香保心丸治疗寒凝心脉型稳定型心绞痛疗效评价及其对炎症因子CD31、CD62P的影响_论文.doc
- 麝香四黄汤治疗出血性中风急性期痰热腑实证的临床研析.doc
- 身份犯和非身份犯共同犯罪定性问题的研析___以“苏某等职务侵占案”为例.doc
- 石家庄市儿童业余钢琴教育的调查和的研析.doc
- 石油化工类企业社会责任会计信息披露问题研析.doc
- 时空耗散结构理论在排球防守技战术中的运用的研析___以对3号位进攻的防守为例.doc
文档评论(0)