- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据分析课程设计》课程实验教学大纲
一、课程基本信息
课程代码课程名称:数据分析课程设计
英文名称: Design of Data Analysis
实验总学时:32学时
适用专业:信息管理与信息系统、大数据管理与应用
课程类别:专业课
先修课程:数据分析方法与工具、商务智能
实验教学的总体目的和要求
1、对学生的要求
能够使用合适的工具(R/PYTHON)及时完成每个项目的实验内容,按时提交实验报告。独立完成综合实验:选取问题、确定目标、获取数据、数据分析、数据可视化、撰写实验报告
2、对教师的要求
熟悉R/python 语言,熟悉数据分析的完整过程,熟悉相关统计知识,能够耐心认真指导学生进行实验操作
3、对实验条件的要求
R软件/Python
实验教学内容
实验项目一 豆瓣电影top250数据爬取和分析
实验名称:豆瓣电影top250数据爬取和分析
实验内容:从豆瓣网爬取电影top250,进行探索性分析和可视化分析
思政教育: 编写爬虫程序时应注意:
采集的信息中是否包含个人隐私或商业机密
对方是否同意或授权采集这些信息
对方是否同意或授权转载,不可擅作主张转载到自己的平台
采集后的信息如何使用,公开展示时是否需要脱敏处理,是否用于盈利
是否会对对方服务器造成伤害,例如拖垮宕机、影响正常业务
非法爬取数据违法,要受到相应的法律制裁。通过案例讲解,提醒同学们注意合法获取数据。
《刑法》第二百一十七条规定的“侵犯著作权罪”
以营利为目的,有下列侵犯著作权情形之一,违法所得数额较大或者有其他严重情节的,处三年以下有期徒刑或者拘役,并处或者单处罚金;违法所得数额巨大或者有其他特别严重情节的,处三年以上七年以下有期徒刑,并处罚金:
(一)未经著作权人许可,复制发行其文字作品、音乐、电影、电视、录像作品、计算机软件及其他作品的;
(二)出版他人享有专有出版权的图书的;
(三)未经录音录像制作者许可,复制发行其制作的录音录像的;
(四)制作、出售假冒他人署名的美术作品的。伤害,例如拖垮宕机、影响正常业务
《刑法》第二百五十三条之一规定的“侵犯公民个人信息罪”
违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。
违反国家有关规定,将在履行职责或者提供服务过程中获得的公民个人信息,出售或者提供给他人的,依照前款的规定从重处罚。
窃取或者以其他方法非法获取公民个人信息的,依照第一款的规定处罚。
单位犯前三款罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员,依照各该款的规定处罚。
实验性质:设计性
实验学时:4
实验目的与要求:
1.掌握Python爬取数据的方法
2.熟悉Python做EDA
3.熟悉Python做数据可视化
实验条件:Python或R
研究与思考:怎么用python爬数据?
实验项目二 推荐系统:基于电影评分的推荐系统设计与实现
实验名称:基于电影评分的推荐系统设计与实现
实验内容:
1.学习协同过滤算法、UBCF和IBCF
2.获取数据
/datasets/movielens/100k/
/255284_5320d823aad2405eaaf41941c0d7b9d2.html#1
3. 对数据进行探索性分析,利用推荐算法对数据分析,
4. 撰写数据分析报告
思政教育:(1)大数据/复杂数据本质上却是非独立同分布的(non-IID),各国之间存在耦合关系,构成了世界共同体
现有理论和商业系统大都假设数据是独立同分布的(IID),而大数据/复杂数据本质上却是非独立同分布的(non-IID),即一个对象的属性和行为,或多或少地会影响另一个对象,比如推荐系统中用户之间存在的夫妻关系、父子关系等都会对推荐商品产生一定程度的影响,因此需要纳入评分公式以提升推荐质量。非独立同分布中存在耦合关系。一个国家是不能独立于世界之外的,各国彼此之间应该相互理解、互相尊重,才能合作共赢。以新冠肺炎疫情防控为例,我国政府通过一系列科学有效的措施,终于控制住了病毒的蔓延。
(2) 凡事有度,过犹不及
随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品,在 信息过载问题中的消费者不断流失。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。但是无处不在的推荐系统也限制了消费者扩大选择范围、做出创新性选择的机会,推荐系统过于密集的主动干预会妨碍受教育者认真思考自己的需求,机械地接受系统的每一步指令,放弃
原创力文档


文档评论(0)