北京化工大学攻读博士学位研究生入学考试.doc

北京化工大学攻读博士学位研究生入学考试.doc

北京化工大学2014攻读博士学位研究生入学考试 《数据分析与挖掘》考试大纲 适用的专业 管理科学与工程。 考试方法和考试时间 考试为闭卷考试,考试时间为3小时。 考试的主要内容 数据挖掘理论基础 数据挖掘的定义;可以进行数据挖掘的模式类型;数据挖掘的技术;数据挖掘的面向类型;数据挖掘的主要问题;数据对象与属性;数据基本统计描述;数据可视化;度量数据的相似相异性;数据清理;数据集成;数据集成;数据归约;数据变化与离散化;数据仓库的概念;数据仓库建模;数据仓库的设计与使用;数据仓库的实现;数据泛化。 数据挖掘模式 数据挖掘频繁项集、闭项集、关联规则的基本概念;频繁项集挖掘方法;模式评估方法;模式挖掘:一个路线图;多层、多维空间中的模式挖掘;基于约束的频发模式挖掘;挖掘高维数据和巨型模式;挖掘压缩或近似模式;模式探索与应用。 分类 分类的基本概念;决策树归纳;贝叶斯分类方法;基于规则的分类;模型评估与选择;提高分类准确度的方法;贝叶斯信念网络;向后传播分类的方法;支持向量机;用频繁模式分类;惰性学习法或从近邻学习;其他分类方法如遗传算法、粗糙集方法、模糊集方法;有关分类的相关问题:多类分类、半监督分类、主动学习、迁移学习。 聚类分析 聚类分析的定义;划分的方法;层次方法;基于密度的方法;基于网格的方法;聚类评估;基于概率模型的聚类;聚类高维数据;聚类图和网络数据;具有约束的聚类。 离群点

文档评论(0)

1亿VIP精品文档

相关文档