《R语言》课程教学大纲.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《R语言》课程教学大纲 总主编 刘鹏 张燕 主编 程显毅 刘颖 朱倩 适合专业: 数据科学与大数据技术专业 课程编号: 先修课程:数理统计、数据库、大数据导论 学分: 4 总学时: 64 一、课程性质、目的与要求 课程性质:专业必修课。 课程目的:本课程是各专业想了解大数据分析技术的学生必修的一门基础课程,具有很强的实践性和应用性。它以《数理统计》、《大数据导论》为基础,主要培养学生大数据分析和计算机编程基本思想和基本技能,为后续的数据挖掘应用性课程和数据产品开发课程的学习打好编程基础。 课程要求:本课程设置的目的是通过对R语言的语法规则、数据结构、数据清晰、数据变换、数据整合、数据可视化、数据建模构的学习,较好地训练学生利用计算机解决对数据进行分析和展现,使学生具有数据分析和数据展现的能力,为培养学生有较强数据开发能力打下良好基础。 二、教学内容 理论总学时:32学时 第1章 绪论 1学时 基本要求: (1)了解R语言特点和优势。 (2)理解数学思维的基本原理。 (3)掌握统计思维的基本原理。 (4)理解逻辑思维的基本原理。 重点:树立正确的思维观。 难点:逻辑思维。 第2章 R语言入门 1学时 基本要求: (1)理解R语言工作空间,环境变量的显示、保存和删除。 (2)了解R包的作用。 (3)能够安装R语言开发环境。 (4)能够编辑和运行R脚本。 (5)R语言基本语法。 重点:R语言脚本编辑和运行。 难点:R包。 第3章 数据类型 4学时 基本要求: (1)掌握向量的产生、引用、合并等操作,包括x:y,seq(),c(),rnorm()。 (2)掌握矩阵的产生、引用、合并、转换等操作。 (3)理解数据的产生、引用、转换等操作。 (4)熟练掌握数据框的产生、引用、转换等操作。 (5)理解列表的产生、引用、转换等操作。 (6)掌握因子的作用、定义和转换。 (7)熟练掌握常量和变量。 (8)基本掌握字符串处理函数。 (9)掌握常用数据类型转换函数。 重点:数据框和向量的应用。 难点:列表和因子的应用。 第4章 数据准备 2学时 基本要求: (1)能用R语言导入文本、Excel、数据库数据。 (2)能用R语言导出数据。 重点:freade和fwrite函数的使用。 难点:数据库数据导入。 第5章 数据可视化 6学时 基本要求: (1)了解数据可视化概念和作用。 (2)理解可视化建议。 (3)了解图表的作用:成分关系图表(柱图、饼图)、对比关系图表(时序图、折线图、面积图)、相关关系图表(散点图、气泡图)、多维比较图表(雷达图、圆环图)。 (4)熟练掌握“散点点图”“折线线图”“直方图”“柱状图”“饼图”“箱线图”“密度图”“直线图”的绘制方法。 (5)理解ggplot2图层绘图原理,并熟练用ggplot2绘图。 重点:ggplot2绘图。 难点:图层原理。 第6章 数据探索 2学时 基本要求: (1)熟练掌握缺失值判定,处理。 (2)熟练掌握异常值判定,处理。 (3)掌握数据统计特征分析方法。 重点:缺失值、异常值判定,分布分析,统计量分析。 难点:缺失值、异常值处理,对比分析,周期分析。 第7章 数据变换 4学时 基本要求: (1)掌握数据规范化基本方法。 (2)能用R语言进行变量增减。 (3)掌握分组汇总,包括列联表table、排序order/sort/rank、聚集aggregate。 (4)掌握数据连接操作。 (5)掌握长表-宽表转换操作,包括stack 和 unstack。 重点:排序,分组汇总。 难点:分组汇总。 第8章 高级编程 2学时 基本要求: (1)熟练掌握缺失值判定,处理。 (2)熟练掌握异常值判定,处理。 (3)掌握数据统计特征分析方法。 重点:缺失值、异常值判定,分布分析,统计量分析。 难点:缺失值、异常值处理,对比分析,周期分析。 第9章 数据建模 8学时 基本要求: (1)理解数据建模概念和作用。 (2)了解数据建模常用方法。 (3)熟练使用rattle进行数据建模。 (4)掌握聚类rattle实现。 (5)掌握关联分析rattle实现。 (6)掌握决策树和随机森林的rattle实现。 (7)理解回归分析基本思想。 (8)能用回归分析模型解决实际应用问题。 (9)了解SVM和神经网络建模基本思想。 重点:rattle数据建模操作。 难点:回归分析原理、关联复习原理。 第10章 模型评估 2学时 基本要求: (1)理解训练集、验证集和测试集作用。 (2)熟练用混淆矩阵进行模型评估。 (3)理解风险图和ROC曲线模型评估方法。 (4)了解模型评估的其它方法。 重点:数据集作用、混淆矩阵的使用。 难点:风险图和ROC方法。 三、实践教学要求 实践总学时:

您可能关注的文档

文档评论(0)

150****0183 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档