- 19
- 0
- 约6.89千字
- 约 32页
- 2016-05-24 发布于山西
- 举报
幻灯片 1_10315
习题 将MovieLens 1M数据集从zip文件中解压出来之后,可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中,对数据进行如下分析操作: (1) 先用pandas的merge函数将ratings跟users合并到一起,然后再将movies也合并进去。 (2) 使用pivot_table方法产生另一个DataFrame,其内容为电影平均得分,行标为电影名称,列标为性别。 (3) 过滤掉评分数据不够500条的电影。 (4) 了解男性观众最不喜欢的电影(对M列升序排列) (5) 得到分歧最大且使用两种方法得到男性观众更喜欢的电影 (6) 通过计算得分数据的方差(var),找出分歧最大的电影(不考虑性别因素) * * * * * * Python程序设计(111100) * 11.1 NumPy简介 11.2 Pandas简介 11.3 数据分析应用 第十一章 Python在数据分析中的应用 数据分析的四大任务 数据准备(读写各种各样的文件格式和数据库) 数据处理(对数据进行清洗、修整、整合等处理以便进行分析) 数据分析(根据分析目的对数据集做合适的数学和统计运算) 数据可视化(展示数据分析成果) * NumPy简介 Numpy(Numerical Python的简称)是Python科学计算的基础包。它提供了以下功能
您可能关注的文档
- 花崗石平台基本平面之三面加工.ppt
- 互联网时代印刷包装行业数字化整体解决方案文稿.ppt
- 胡晴舫《人间喜剧》 导读.ppt
- 互联网+知识产业.ppt
- 华文网路巡回教学华语文教学网路资源.ppt
- 呼吸系統概論 - emt-2上課補充講義.ppt
- 华南深部找矿问题.ppt
- 华中科技大学图书馆消防知识培训手册.ppt
- 化工过程控制工程习题集_12188.ppt
- 环境保护专题 - 敬畏自然演示文稿.ppt
- 第一节 电阻和变阻器(讲义)物理沪科版2024九年级全一册.docx
- 第3节 质量的测量 (讲义) 物理沪科版(五四学制)2024 八年级上册.docx
- 第14讲 圆周运动(复习讲义)高考物理一轮复习.docx
- 暑假预习专题15 指数函数(20题型)新高一数学讲义(沪教版2020).docx
- 第二节 发电机是怎样工作的(讲义)物理沪科版2024九年级全一册.docx
- 4.18 东晋南朝政治和江南地区开发 教学设计 部编版七年级上学期历史.docx
- 2.5实验:用单摆测量重力加速度(表格式教学设计)物理人教版2019选择性必修第一册.docx
- 第49讲 沉淀溶解平衡及图像分析(讲义)高考化学复习讲义(新教材新高考).docx
- 旅游景区行业分析报告:内外兼修,多元创新.pdf
- Unit 1~2 单元语法知识点梳理 高二下学期期中考点(上教版2020选择性必修第二册).pptx
原创力文档

文档评论(0)