《大数据应用案例》课程教学大纲.docx

《大数据应用案例》课程教学大纲.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《大数据应用案例》教学大纲

课程编号:121312B

课程类型:□通识教育必修课□通识教育选修课

□学科基础课□专业核心课

?专业提升课□专业拓展课

总学时:32讲课学时:32实验(上机)学时:0

学分:2

考试类型:□考试?考查

适用对象:数据科学与大数据技术专业

□是?否适合作为其他专业学生的个性化选修课

先修课程:数据科学导论、大数据计算机基础

一、教学目标

该课程是针对统计学(大数据分析)本科学生开设的,其主要目的是通过若干案例为学生展示大数据分析技术在社会经济各领域的应用情况。本课程以实际工作中的案例进行实训教学,达到的教学目标是:

目标1:增强学生提出问题的能力

目标2:增强学生分析问题的能力

目标3:增强学生实际动手解决问题的能力

目标4:培育有坚定理想信念、深厚爱国主义情怀、高尚道德情操,具有灵活处理数据能力,坚韧奋斗进取品格的社会主义新青年

二、教学内容及其与毕业要求的对应关系

重点讲授R与python编程基础、数据结构和数据预处理和常用统计分析方法的基本思路和软件实现,R与python面向对象的编程是本课程的难点内容,课程拟结合实际工作中的案例数据对该部分内容进行举一反三来强化学生的学习和训练学生的数据分析思维。课程内容以多媒体的课件讲授为主,同时上机应用R与python对统计分析的各常用方法进行实现,上机完成每种方法的练习。采用课堂练习和课后作业方式对学生掌握知识情况进行考核,建议采用开卷或论文方式进行课程考核,本课程平时成绩占30%,期末考试成绩占70%。

三、各教学环节学时分配

以表格方式表现各章节的学时分配,表格如下:

教学课时分配

序号

章节内容

讲课

实验

其他

合计

1

案例1:北京市人口及就业结构

4

0

?0

4

2

案例2:COVID-19疫情与气象因素的关系

4

0

?0

4

3

案例3:共享单车需求量预测

4

0

?0

4

4

案例4:最低气温与最高气温预报

4

0

?0

4

5

案例5:北京市房价影响因素

4

0

?0

4

6

案例6:基于眼底数字图像对糖尿病视网膜病变的诊断

4

0

0

4

7

案例7:基于生成对抗网络的图像合成

4

0

0

4

8

案例8:Google用户对欧洲景点的评分关联

4

0

0

4

合计

32

0

0

32

四、教学内容

案例1:北京市人口及就业结构

十四五中,国家再次提出“积极应对人口老龄化”命题。人口老龄化是社会发展的重要趋势,是人类文明进步的体现,也是今后较长一段时期我国的基本国情。进入21世纪,随着国家各项发展政策的开展落实,北京市人口发展的内在动力和外部条件也在发生变化,同时也面临着人口结构上如就业不平等、就业困难、老龄化等问题。如何在国家人口趋于老龄化的同时,把握城市人口变化趋势以及就业结构的特征,做好相应的应对措施,对维持北京市经济社会稳定与发展开拓新兴领域具有较大意义。

本案例从《北京市统计年鉴》和《北京市1%人口抽样调查数据》以及《北京市区域统计年鉴》入手,运用描述性统计分析方法对北京市常驻人口和就业人口进行分析;对不同职业的就业人口结构进行特征的分析。在综合分析后得出北京市人口结构在就业结构上存在的问题,和未来在北京市规划发展路上存在的问题。

教学的重点和难点:本章的重点和难点都是数据的类型,讲授清楚不同类型的数据如何区分。

课程考核要求:要求掌握数据的概念,会区分数据的类型。

课程思政切入点:数据质量的重要性,培养“求真务实”品德。

案例2:COVID-19疫情与气象因素的关系

自2020年以来,COVID-19新型冠状病毒在政府与民众还未来得及反映的情况下席卷了全国乃至全世界,成为近几十年内全球范围内最严重的健康安全威胁。该案例采用描述性分析、相关性分析探讨气象因素与COVID-19新型冠状疫情的相关关系。通过描述性分析结果来看结果显示了因变量和自变量的基本分布情况,同时发现各自变量的数量级相差较多,因此对部分变量进行了特征缩放的预处理,使后续的分析更加准确。经过简单的描述性分析后,采用计算协方差的方法进行了各变量间的相关关系的检验,认为长波辐射、相对湿度、每日最低温度和海平面气压等气象因素存在一定的相关关系,后续根据这些因素进行回归预测也有一定的可信度。通过绘制的每日新增确诊与气象因素的散点图、每日新增死亡与各气象因素的散点图,发现线性关系并不是很明显,但是散点图成一定的形状,因此猜想存在较为复杂的相关关系。而且每日新增确诊和每日新增死亡的时间序列图可以看出明显的波动,因此决定采用LSTM神经网络进行回归预测。经过进一步的回归预测,回归的效果比较好。

教学的重点和难点:本章的重点和难点都是数据的可视化与探索性分析。

课程考核要求:要求

文档评论(0)

CUP2008013124 + 关注
实名认证
内容提供者

北京教育部直属高校教师,具有十余年工作经验,长期从事教学、科研相关工作,熟悉高校教育教学规律,注重成果积累

1亿VIP精品文档

相关文档