- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘习题二
数据挖掘习题二简答:何谓数据挖掘?它有哪些方面的功能?何谓数据仓库?为什么要建立数据仓库?常见的分箱方法有哪些?数据平滑处理的方法有哪些?何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。数据挖掘讨论题1、(20分)讨论::下列每项活动是否是数据挖掘任务?简单陈述你的理由。根据性别划分公司的顾客。根据可赢利性划分公司的顾客。预测投一对骰子的结果。使用历史记录预测某公司未来的股票价格。简答:何谓数据挖掘?它有哪些方面的功能?从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘。相关的名称有知识发现、数据分析、数据融合、决策支持等。数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等。何谓数据仓库?为什么要建立数据仓库?数据仓库是一种新的数据处理体系结构,是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,为企业决策支持系统提供所需的集成信息。建立数据仓库的目的有3个:一是为了解决企业决策分析中的系统响应问题,数据仓库能提供比传统事务数据库更快的大规模决策分析的响应速度。二是解决决策分析对数据的特殊需求问题。决策分析需要全面的、正确的集成数据,这是传统事务数据库不能直接提供的。三是解决决策分析对数据的特殊操作要求。决策分析是面向专业用户而非一般业务员,需要使用专业的分析工具,对分析结果还要以商业智能的方式进行表现,这是事务数据库不能提供的。常见的分箱方法有哪些?数据平滑处理的方法有哪些?分箱的方法主要有:统一权重法(又称等深分箱法)统一区间法(又称等宽分箱法) 最小熵法自定义区间法数据平滑的方法主要有:平均值法、边界值法和中值法。何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如0.0~1.0),称为规范化。规范化的常用方法有:最大-最小规范化:零-均值规范化:小数定标规范化:x=x0/10α数据挖掘讨论题1、(10分)讨论::下列每项活动是否是数据挖掘任务?简单陈述你的理由。根据性别划分公司的顾客。不是。数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术服务用来探查大型数据库,发现先前未知的有用模式。还可以预测未来观测结果,例如,预测一位新的顾客是否会在一家百货公司消费100美元以上。但并非所有的信息发现任务都被视为数据挖掘,数据挖掘与信息检索不同,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索领域的任务,它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。数据挖掘的任务可分为两大类:预测任务和描述任务。主要任务有四种:聚类分析,关联分析,异常检测,和预测建模。其目的是根据其它属性的值,预测特定属性的值,或导出概括数据中潜在联系的模式,主要是预测某些信息。而根据性别划分公司的顾客,只是一种简单的数据库查询操作,并没有涉及预测分析。根据可赢利性划分公司的顾客。不是。根据可赢利性划分公司的顾客是使用阈值进行的一种统计计算。它仅仅是根据消费结果统计将原有顾客进行划分,只是一种统计的结果,而没有根据这些结果的特点预测一个新的顾客的赢利性,这种预测才是数据挖掘。预测投一对骰子的结果。不是。因为骰子的六个数值出现的可能性是相同的,这是一种概率计算,如果结果出现的可能性是不确定的,不相同的,则更像是数据挖掘的任务,但在很早以前利用数学已经能够很好的解决这个问题了。所以预测投一对骰子的结果不属于数据挖掘的任务,不带有发现新信息的预测特点。使用历史记录预测某公司未来的股票价格。这是数据挖掘的任务。可以通过对历史记录特点的分析来创建一种模型预测未来的公司的股票价格,这是数据挖掘任务中预测建模的一个例子,预测建模涉及以说明变量函数的方式为目标变量建立模型,有两类预测建模任务:分类,用于预测离散的目标变量;回归,用于预测连续的目标变量dmj预测某公司未来的股票价格则是回归任务,因为价格具有连续值属性。
文档评论(0)