决策树习题.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策树习题

习题 [1]商务智能产生的原因是什么? [2]怎么认识商务智能? [3]商务智能对企业有什么价值? [4]举例说明商务智能在保险、证券、银行、电信、制造、零售和物流等行业的应用。 [5]讨论商务智能与ERP、CRM和SCM等业务管理系统的关系。 [6]商务智能系统包括哪些部分?分别有什么功能? [7]结合具体的商务智能项目,说明商务智能系统的组成。 [8]讨论数据集成对商务智能项目的重要性。 [9]阅读下面的案例,分析产生问题的原因并给出对策。 一位新上任的大型国企老总曾经表达过这样的困惑。当他向下属提出,希望查看近十年企业的生产和运营数据时,他手边得到了各种各样不同的数据报表。这些数据报表大致可以分成两种类型:一种是两年前,即ERP上线之前的,这是一些简单、杂乱而又枯燥的数据。另一种是有了ERP以后的,数据变得清楚而有条理,但仍然有来自ERP、CRM、SCM以及计费业务等不同应用的数据和各种分析报告。 在仔细查看这些报表之后,这位国企老总惊讶地发现,不同的系统可以得出截然相反的两种结论。例如某一产品,它的动态成本反映在ERP系统和CRM、SCM系统中相差很大,如果引用ERP和CRM里面的数据,它就是一款很成功、销量很好的产品,但在SCM中,它的采购和物流成本过高,导致了这款看起来很成功的产品实际上是一笔赔钱的买卖。 更让他难以理解的是,正是由于这些来自不同系统的数据不够准确或不一致,给企业的前任领导提交了相当多顾此失彼的分析报告,导致了许多市场决策上的混乱和失误。在花费了大量时间和精力之后,这位国企老总困惑了:究竟哪些数据才是真实的?为什么对同一件事不同的系统会得到截然不同的结果? [10]讨论数据仓库与操作型数据库、数据集市的区别。 [11]如何认识数据仓库的几个特点?这些特点与企业管理决策有什么关系? [12]什么是元数据?元数据有什么用处? [13]讨论ETL的过程,其中数据质量对这个过程有什么影响? [14]什么是操作数据存储(ODS)?为什么使用ODS? [15]数据仓库有哪些模型?举例说明。 [16]举例说明数据挖掘查询语言(DMQL)的应用。 [17]以销售主题为例,给出数据仓库的概念模型和逻辑模型,并用DB2或Microsoft SQL Server2000 Analysis Services(以上版本)实现。 [18]什么是在线分析处理(OLAP)?OLAP有哪些特点? [19]OLAP和OLTP有什么区别?怎么理解OLAP是假设驱动型的分析方法? [20]OLAP有哪些操作?请结合实例,利用IBM DB2 OLAP Server或Microsoft SQL Server 2000 Analysis Services(以上版本)讨论。 [21]OLAP有哪几种类型?它们有什么区别? [22]结合实例,讨论OLAP操作语言的应用。 [23]数据挖掘是怎么产生的? [24]数据挖掘有哪些步骤?以电信运营商的顾客细分为例,分析每一步骤关键的问题。 [25]作为一种数据挖掘方法和展示工具,举例说明可视化技术的应用。 [26]举例说明数据挖掘在银行、保险、电信、零售或政府管理中的应用。 [27]数据预处理在数据挖掘过程中有什么用处?常见的预处理方法有哪些?请举例说明。 [28]聚类算法的实质是什么?常用的几种聚类算法各适用什么场合?请举例说明某种聚类算法的应用。 [29]分别取k=2和3,利用k-means聚类算法对以下的点聚类:(2,1),(1,2),(2,2),(3,2),(2,3),(3,3),(2,4),(3,5),(4,4),(5,3),并讨论k值以及初始聚类中心对聚类结果的影响。 [30]分类问题的实质是什么?有哪些常用的方法? [31]表1是购买汽车的顾客分类训练样本集。假设顾客的属性集家庭经济状况、信用级别和月收入之间条件独立,则对于某顾客(测试样本),已知其属性集X=一般,优秀,12K,利用朴素贝叶斯分类器计算这位顾客购买汽车的概率。 表1 购买汽车的顾客训练样本集 序号 家庭经济状况 信用级别 月收入 购买汽车 1 一般 优秀 10K 是 2 好 优秀 12K 是 3 一般 优秀 6K 是 4 一般 良好 8.5K 否 5 一般 良好 9K 否 6 一般 优秀 7.5K 是 7 好 一般 22K 是 8 一般 一般 9.5K 否 9 一般 良好 7K 是 10 好 良好 12.5K 是 [32]决策树算法的实质是什么?以机器学习数据库中splice数据集为例,回答下面问题: (1)分别计算信息增益和gini指数,哪个属性选择为决策树根结点的分枝属性? (2)使用ID3算法构造决策树。 注:splice数据集下载地址:/ml/datasets/ [33]连续属性如何离

文档评论(0)

tmd2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档