习题及参考答案.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
习题参考答案 第1章绪论 1.1 数据挖掘处理的对象有哪些?请从实际生活中举出至少三种。 答:数据挖掘处理的对象是某一专业领域中积累的数据,对象既可以 来自社会科学,又可以来自自然科学产生的数据,还可以是卫星观 测得到的数据。数据形式和结构也各不相同,可以是传统的关系数 据库,可以是面向对象的高级数据库系统,也可以是面向特殊应用 的数据库,如空间数据库、时序数据库、文本数据库和多媒体数据 库等,还可以是Web数据信息。 实际生活的例子: ①电信行业中利用数据挖掘技术进行客户行为分析,包含客户通 话记录、通话时间、所开通的服务等,据此进行客户群体划分以 及客户流失性分析。 ②天文领域中利用决策树等数据挖掘方法对上百万天体数据进行 分类与分析,帮助天文学家发现其他未知星体。 ③制造业中应用数据挖掘技术进行零部件故障诊断、资源优化、 生产过程分析等。 ④市场业中应用数据挖掘技术进行市场定位、消费者分析、辅助 制定市场营销策略等。 1.2 给出一个例子,说明数据挖掘对商务的成功是至关重要的。该商 务需要什么样的数据挖掘功能?它们能够由数据查询处理或简 单的统计分析来实现吗? 答:例如,数据挖掘在电子商务中的客户关系管理起到了非常重要的 作用。随着各个电子商务网站的建立,企业纷纷地从“产品导向” 1 / 56实用精品文档 转向“客户导向”,如何在保持现有的客户同时吸引更多的客户、 如何在客户群中发现潜在价值,一直都是电子商务企业重要任 务。但是,传统的数据分析处理,如数据查询处理或简单的统计 分析,只能在数据库中进行一些简单的数据查询和更新以及一些 简单的数据计算操作,却无法从现有的大量数据中挖掘潜在的价 值。而数据挖掘技术却能使用如聚类、关联分析、决策树和神经 网络等多种方法,对数据库中庞大的数据进行挖掘分析,然后可 以进行客户细分而提供个性化服务、可以利用挖掘到的历史流失 客户的特征来防止客户流失、可以进行产品捆绑推荐等,从而使 电子商务更好地进行客户关系管理,提高客户的忠诚度和满意 度。 1.3 假定你是 Big-University 的软件工程师,任务是设计一个数据挖 掘系统,分析学校课程数据库。该数据库包括如下信息:每个学 生的姓名、地址和状态(例如,本科生或研究生)、所修课程,以 及他们的GPA。描述你要选取的结构,该结构的每个成分的作用 是什么? 答:任务目的是分析课程数据库,那么首先需要有包含信息的关系型 数据库系统,以便查找、提取每个属性的值;在取得数据后,需 要有特征选择模块,通过特征选择,找出要分析的属性;接下来 需要一个数据挖掘算法,或者数据挖掘软件,它应该包含像分类、 聚类、关联分析这样的分析模块,对选择出来的特征值进行分析 处理;在得到结果后,可以用可视化软件进行显示。 2 / 56实用精品文档 1.4 假定你作为一个数据挖掘顾问,受雇于一家因特网搜索引擎公 司。通过特定的例子说明,数据挖掘可以为公司提供哪些帮助, 如何使用聚类、分类、关联规则挖掘和离群点检测等技术为企业 服务。 答: (1)使用聚类发现互联网中的不同群体,用于网络社区发现; (2)使用分类对客户进行等级划分,从而实施不同的服务; (3)使用关联规则发现大型数据集中间存在的关系,用于推荐搜索。 如大部分搜索了“广外”的人都会继续搜索“信息学院”,那么 在搜索“广外”后会提示是否进进一步搜索“信息学院”。 (4)使用离群点挖掘发现与大部分对象不同的对象,用于分析针对 网络的秘密收集信息的攻击。 1.5 定义下列数据挖掘功能:关联、分类、聚类、演变分析、离群点 检测。使用你熟悉的生活中的数据,给出每种数据挖掘功能的例 子。 答:关联是指发现样本间或样本不同属性间的关联。例如,一个 数据挖掘系统可能发现的关联规则为:major(X, “computing science”) owns(X, “personal computer ”) [suppo

文档评论(0)

166****9181 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档