《超高维数据分析》课程教学大纲.docx

《超高维数据分析》课程教学大纲.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《超高维数据分析》教学大纲

课程编号:121393B

课程类型:□通识教育必修课□通识教育选修课

□学科基础课□专业核心课

?专业提升课□专业拓展课

总学时:48讲课学时:32实验(上机)学时:16

学分:3

考试类型:□考试?考查

适用对象:数据科学与大数据技术统计学专业

□是?否适合作为其他专业学生的个性化选修课

先修课程:应用数理统计、大数据分析统计基础、大数据分析计算机基础

一、教学目标

超高维数据分析课程是大数据分析方向硕士学生的专业课程。通过本课程的学习,使学生能够了解超高维数据的概念,掌握超高维数据的分类方法、聚类方法、变量选择方法,理解这些方法的基本原理和思想,培养学生对超高维数据进行分析和处理的能力。

目标1:了解超高维数据的基本概念

目标2:掌握超高维数据的分类方法及基本思想

目标3:掌握超高维数据的聚类方法及基本思想

目标4:掌握超高维数据的变量选择方法

目标5:培育有坚定理想信念、深厚爱国主义情怀、高尚道德情操,具有扎实统计专业学识,坚韧奋斗进取品格的社会主义新青年。

二、教学内容及其与毕业要求的对应关系

本课程可对超高维数据的分类、聚类、以及变量选择方法进行详细讲解,对回归分析中的贝叶斯变量选择方法根据实际情况进行选讲。对于较难理解的算法思想和较复杂的算法流程,可以人为构造简单的数据进行举例说明,对算法流程进行分步演示。

本课程采取教师理论讲解和学生上机实践操作相结合的方式进行,力求通过本课程的学习使学生掌握超高维数据分析的基本方法并能够运用这些方法进行实际编程分析。

在实践教学环节中,教师提供具体数据,要求学生能够利用所学的方法进行编程,并能够对程序结果进行分析。

现代科学技术和社会经济的许多领域都会遇到超高维数据的统计分析问题,超高维数据是大数据统计分析中常见的一种数据,掌握超高维数据的基本分析方法是对大数据分析方法硕士毕业生的基本要求。

三、各教学环节学时分配

以表格方式表现各章节的学时分配,表格如下:

教学课时分配

序号

章节内容

讲课

实验

其他

合计

1

初识超高维数据

2

0

2

2

超高维数据分类

4

4

8

3

超高维数据聚类

10

4

14

4

变量选择

8

4

12

5

回归分析中的贝叶斯变量选择

8

4

12

合计

32

16

48

四、教学内容

第一章初识超高维数据

第一节超高维数据的基本概念

第二节传统降维方法简介

第三节超高维数据处理领域的发展现状

第四节超高维数据应用领域举例

教学重点、难点:在超高维数据分析中,传统降维方法的局限性;对样本量远远小于变量个数时形成维数灾难的理解。

课程的考核要求:了解超高维数据的概念;理解传统降维方法的局限性;了解维数灾难。

课程思政切入点:数据降维的重要性,培养“求真务实”、“探求本质”的品德。

复习思考题:

传统降维方法主要有哪些?在超高维数据中,传统降维方法是否适用?

在哪些领域中常见超高维数据?

第二章超高维数据分类

第一节分类的基本概念

第二节维数对分类的影响

第三节基于距离的分类方法

第四节基于损失的分类方法

第五节实例分析

教学重点、难点:对基于距离的分类方法的理解和运用;对基于损失的分类方法的理解和运用。

课程的考核要求:理解维数对分类的影响;掌握基于距离以及基于损失的分类方法;能够运用不同的分类方法对超高维数据进行分类。

课程思政切入点:对世界上的主要国家按照不同分类方法进行分类,培养学生爱国情怀。

复习思考题:

基于距离的分类方法有哪些?有何特点?

基于损失的分类方法有哪些?有何特点?

第三章超高维数据聚类

第一节简介

第二节聚类与分类

第三节子空间聚类

第四节基于相似性度量的聚类

第五节实例分析

教学重点、难点:对各种聚类算法思想的理解。

课程的考核要求:理解各种聚类算法的基本思想;掌握各类聚类算法的基本步骤;能够运用不同的聚类算法对超高维数据进行聚类。

课程思政切入点:对世界上的主要国家进行聚类,培养学生爱国情怀。

复习思考题:

子空间聚类算法的基本思想?

基于相似性度量的聚类算法的基本思想?

第四章变量选择

第一节简介

第二节变量选择的必要性

第三节传统的变量选择方法

第四节贝叶斯和随机搜索

第五节超高维数据的变量选择方法

教学重点、难点:对传统变量选择方法局限性的理解;对超高维数据的变量选择方法的理解与运用。

课程的考核要求:掌握超高维数据的变量选择方法,能够针对具体实例编写程序进行变量选择。

复习思考题:

超高维数据的变量选择方法有哪些?有何特点?

针对具体的超高维数据,编写程序进行变量选择。

课程思政切入点:变量选择的重要性,培

文档评论(0)

CUP2008013124 + 关注
实名认证
内容提供者

北京教育部直属高校教师,具有十余年工作经验,长期从事教学、科研相关工作,熟悉高校教育教学规律,注重成果积累

1亿VIP精品文档

相关文档