- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《R语言》课程教学大纲
总主编 刘鹏 张燕
主编 程显毅 刘颖 朱倩
适合专业: 数据科学与大数据技术专业 课程编号:
先修课程:数理统计、数据库、大数据导论
学分: 4 总学时: 64
一、课程性质、目的与要求
课程性质:专业必修课。
课程目的:本课程是各专业想了解大数据分析技术的学生必修的一门基础课程,具有很强的实践性和应用性。它以《数理统计》、《大数据导论》为基础,主要培养学生大数据分析和计算机编程基本思想和基本技能,为后续的数据挖掘应用性课程和数据产品开发课程的学习打好编程基础。
课程要求:本课程设置的目的是通过对R语言的语法规则、数据结构、数据清晰、数据变换、数据整合、数据可视化、数据建模构的学习,较好地训练学生利用计算机解决对数据进行分析和展现,使学生具有数据分析和数据展现的能力,为培养学生有较强数据开发能力打下良好基础。
二、教学内容
理论总学时:32学时
第1章 绪论 1学时
基本要求:
(1)了解R语言特点和优势。
(2)理解数学思维的基本原理。
(3)掌握统计思维的基本原理。
(4)理解逻辑思维的基本原理。
重点:树立正确的思维观。
难点:逻辑思维。
第2章 R语言入门 1学时
基本要求:
(1)理解R语言工作空间,环境变量的显示、保存和删除。
(2)了解R包的作用。
(3)能够安装R语言开发环境。
(4)能够编辑和运行R脚本。
(5)R语言基本语法。
重点:R语言脚本编辑和运行。
难点:R包。
第3章 数据类型 4学时
基本要求:
(1)掌握向量的产生、引用、合并等操作,包括x:y,seq(),c(),rnorm()。
(2)掌握矩阵的产生、引用、合并、转换等操作。
(3)理解数据的产生、引用、转换等操作。
(4)熟练掌握数据框的产生、引用、转换等操作。
(5)理解列表的产生、引用、转换等操作。
(6)掌握因子的作用、定义和转换。
(7)熟练掌握常量和变量。
(8)基本掌握字符串处理函数。
(9)掌握常用数据类型转换函数。
重点:数据框和向量的应用。
难点:列表和因子的应用。
第4章 数据准备 2学时
基本要求:
(1)能用R语言导入文本、Excel、数据库数据。
(2)能用R语言导出数据。
重点:freade和fwrite函数的使用。
难点:数据库数据导入。
第5章 数据可视化 6学时
基本要求:
(1)了解数据可视化概念和作用。
(2)理解可视化建议。
(3)了解图表的作用:成分关系图表(柱图、饼图)、对比关系图表(时序图、折线图、面积图)、相关关系图表(散点图、气泡图)、多维比较图表(雷达图、圆环图)。
(4)熟练掌握“散点点图”“折线线图”“直方图”“柱状图”“饼图”“箱线图”“密度图”“直线图”的绘制方法。
(5)理解ggplot2图层绘图原理,并熟练用ggplot2绘图。
重点:ggplot2绘图。
难点:图层原理。
第6章 数据探索 2学时
基本要求:
(1)熟练掌握缺失值判定,处理。
(2)熟练掌握异常值判定,处理。
(3)掌握数据统计特征分析方法。
重点:缺失值、异常值判定,分布分析,统计量分析。
难点:缺失值、异常值处理,对比分析,周期分析。
第7章 数据变换 4学时
基本要求:
(1)掌握数据规范化基本方法。
(2)能用R语言进行变量增减。
(3)掌握分组汇总,包括列联表table、排序order/sort/rank、聚集aggregate。
(4)掌握数据连接操作。
(5)掌握长表-宽表转换操作,包括stack 和 unstack。
重点:排序,分组汇总。
难点:分组汇总。
第8章 高级编程 2学时
基本要求:
(1)熟练掌握缺失值判定,处理。
(2)熟练掌握异常值判定,处理。
(3)掌握数据统计特征分析方法。
重点:缺失值、异常值判定,分布分析,统计量分析。
难点:缺失值、异常值处理,对比分析,周期分析。
第9章 数据建模 8学时
基本要求:
(1)理解数据建模概念和作用。
(2)了解数据建模常用方法。
(3)熟练使用rattle进行数据建模。
(4)掌握聚类rattle实现。
(5)掌握关联分析rattle实现。
(6)掌握决策树和随机森林的rattle实现。
(7)理解回归分析基本思想。
(8)能用回归分析模型解决实际应用问题。
(9)了解SVM和神经网络建模基本思想。
重点:rattle数据建模操作。
难点:回归分析原理、关联复习原理。
第10章 模型评估 2学时
基本要求:
(1)理解训练集、验证集和测试集作用。
(2)熟练用混淆矩阵进行模型评估。
(3)理解风险图和ROC曲线模型评估方法。
(4)了解模型评估的其它方法。
重点:数据集作用、混淆矩阵的使用。
难点:风险图和ROC方法。
三、实践教学要求
实践总学时:
您可能关注的文档
- (080800)电气工程学科2020级全日制直博生培养方案.docx
- (活动方案样例)桌面自动售卖机.docx
- (一)分项报价明细表日用品和普通试剂报价明细表.docx
- (一)建筑类项目报规划部门的材料.docx
- (一)建筑物拆除要求.docx
- (一)评标办法和标准.docx
- (一期50td回转窑焚烧线)项目固废防治污染设施竣工环境.docx
- 《棒垒球选项课》.docx
- 《薄膜物理》课程教学大纲.docx
- 《操作系统》课程实验教学大纲.docx
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
原创力文档


文档评论(0)