基于决策树的货票数据挖掘系统的研究.docVIP

基于决策树的货票数据挖掘系统的研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
郑州大学 硕士学位论文 基于决策树的货票数据挖掘系统的研究 姓名:王惠坡 申请学位级别:硕士 专业:计算机软件与理论 指导教师:叶阳东 P Dfe bt ibiaWsSed),护丽弹毬幷 W i tht h e d e v c o 1 h 石 tte j Qrfld,s P o-^r c h a c tsas the sub. s y s temoft her r r e nt resource reasonablyandacq U H U M bk 冬 ft h e m a r k e ting d e p a rtment and I T d T i c A n § 1 o g y h a s e s t o u s e, OLAP server, ordatafi lee tc, w h b i 1 1 s y s temdi rec t 1 y ? A i m i n g a tt h e f a g |gi範通艇fi樹bsM圃诚嗣 数据挖掘技术在经过 了大量的软件产品,在社, 统的特殊性和分析人员的娄 直未能应用到铁路货运营4 发了一个适用于货票数据技 应用于铁路货运营销分析, 价值的决策信息来指导楚 神经生物学等领域作了大 贝叶斯分类、贝叶斯网经 于风险评估、医疗诊断、 界和学术界的极大羌注。 决策树分类是以实纟 序、无规律的实例中推51 归方式,在决策树的内咅【 向下的分枝,在决策树滋 上。该系统储存着近几年 信息。目前在这些数据上丿 策信息,进行真『 挖掘技术同 挖掘技术同 行分析处理,产生用于铁 运营销分析中有着广泛的丄 货运营销分析提供许多方i 式指导营销分析和运输生丿 第六章结束F 第六章结束 F 二 [■ ■ I - ■IlB I 起来,使得应用领域分析 另一方面也为决策树分类 1?3本文结构框架 本文简要介绍了数扼 内容和意义,重点介绍针 HPM i n e r的设计思住 第一童绪论 介绍本课 货票信息系统是铁路运 货物运输的整个过程,及时 满足运输调度指挥的需要, 运营销分析是铁路营销分析 源、货流的统计、分析和预 基 基于上述理由,铁道部 息管理系统。主要研究内容: 手工制票的信息收集工作: 的接口标准;制定有关货票 立分局、路局、铁道部处理〕 处理软件。系统运行在多种 货票信息综合到~起,从货 收费、运输:从信息发送分 时反映铁路各地区间的货彳 为铁路核心部门宏观决策扌 管理提供基础信息,为货返 2 . 2铁路货运营销分 货运营销分析是采用- 货源情况、货流情况和效j 出关于运能安排和货源组乡 动。 这些初步的统辻话动仅能〉 所需的决策知识。货运营4 活电^它面向的对象是大审 必且用 活电^它面向的对象是大审 必且用 出指导货车营运的非平凡; 需要。 未文中,我们利用我 生急需解决的几个问是 -L ( 1)保价收入分* 是铁路营销分析的一个重芋 属性分析货源、货流和货交 货源组织、车流安排和进彳; 货运营销分析具有很 部门能够迅速有效地掌握发 排空量,使其更有效地适丄 运营销分析中得到的各种f 式,都能够为铁路高层领- 调廛鑫離有效的管理,及涉 毂集的类 随着数据库技术的飞戈 的数据急剧增加,如何有必 课题。数据挖掘技术正是圧 3. 1数据挖掘概述 随着数据库技术的飞1 的数据急剧增加,可是目诵 3 值,C表示类别。 训练集是构造分类器邸 其中的一个属性被指定为夕 性的可能值的数目越少越交 出来的分类器的错误率越低 从训1练集中自动地彳 器后,可以利用它来对数据 值也可以用分类器来预测。 在树的每个节点上使 这种轟称作属性选择度巻 大爛压缩)的属性作为当卡 1( S j = -ZP 其中,p i J =: 概率。I」 在A上分枝将获得的勿 G a i n( s . 0 — I 换言之,G a i n翻J是吃 算法计算每个属性的不 的测试属性。创建一个节点 才行。 步,但发展速度很快,随于 产软件产品。 3 4 . 1 B u s i n e s s M i n e 1 BusinessM b j e c t s软甘 包中的一个组件,它龛?, 单独使用,也可以和Eu 摄豁艇杈坡据文件 BusinessObj (2)决策树算法要习 性常常是连续型的,必须作F: 我们希望将作为分类属性的 连续属性的离散化也不能影 BusinessMi 使得它可以作为分类属性, 制后再进行手工更改数据内纟 也对分析人员提出了更高的 D(坯M iBnUeSr 1(12 £ 0 第四章货票数扌 我们设计开发的基于1 营销分析的实际需求和上丿 该系统以满足货运营销分析 尝试。 4. 1 H PM i n e r 的设计 数据挖掘技术经过十 系统通过AD 0. N r数据 库。用户可以指定数据库类2 选择分

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档