2017-2018年学期数据挖掘作业.docxVIP

  • 134
  • 0
  • 约6.09千字
  • 约 8页
  • 2018-07-05 发布于上海
  • 举报
2017‐2018 学期数据分析与挖掘课程试题 请简要介绍数据挖掘技术的产生背景。(5’) 答:随着通信、计算机和网络技术的快速发展,数据正以空前的速度产生和被收集。在各行各业许多公司已经开始认识到客户对业务非常重要,客户信息是他们的宝贵财富。大量信息在给人们带来方便的同时也带来了一大堆问题:信息冗余、信息真假难以辨识、信息安全难以保证、信息形式不一,难以统一处理等,人们淹没在数据中而难以快速制定合适的决策。在强大的商业需求驱动下,商家开始注意到有效的解决大容量数据的利用问题具有巨大商机,学者们开始思考如何从大容量数据集中获取有用信息和知识。面对这一挑战,数据挖掘技术应运而生,并显示出强大的生命力。利用数据挖掘工具进行数据分析可以发现重要的数据模式,这对商务策略、知识库、科学有重大贡献。请介绍数据挖掘包括哪些任务,并简要描述具体任务的工作内容。(5’) 答:数据挖掘任务可以分为预测性和描述性任务。预测性任务如回归、分类、离群点检测,描述性任务如聚类分析、关联分析、序列模式挖掘。聚类(Clustering)分析:“物以类聚,人以群分”。聚类分析技术试图找出数据集中的共性和 差异,并将具有共性的对象聚合在相应的类中。聚类可以帮助决定哪些组合更有意义,广泛应用于客户细分、定向营销、信息检索等等。分类(Classification)分析:通过分析示例数据库中的数据为每个类别做出准确的描述

文档评论(0)

1亿VIP精品文档

相关文档