《数据可视化技术》 课件 03 分析电影评论评分、04 Matplotlib综合运用.pptx

《数据可视化技术》 课件 03 分析电影评论评分、04 Matplotlib综合运用.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

单元3分析电影评论评分

项目介绍项目一:影评数据分析与可视化本项目从某电影网站采集了电影《流浪地球》的部分评论数据,包括城市、影评内容、评分、评论时间、评论点赞数等,根据采集的数据对电影评论的数量、点赞数和评分三个方面进行分析,完成数据分析可视化,给对科幻电影感兴趣的观影者、电影投资者提供一些参考。

01准备活动点名、复习本次课学习内容、学习目标介绍

学习内容任务三分析电影评论评分本任务从评论评分与城市名称、评分等级三个方面来分析电影评论评分。通过绘制面积图、折线图和词云图对电影评论评分情况进行分布分析、对比分析,以便全面挖掘该电影的口碑、观影热度、观众对电影的理解等信息,为观众提供观影参考任务分解:子任务1评论评分与城市的关系分析(面积图)子任务2评论评分好评与差评的关键信息分析(词云图)

学习目标1、知识(1)掌握matplotlib面积图的绘制方法(2)掌握jieba分词(3)掌握pandas统计词频的方法(4)掌握matplotlib词云的绘制方法2、技能(1)能使用jieba分词处理文本(2)能使用matplotlib子库plotlib根据数据绘制面积图和词云图3、素养(1)严谨认真、代码规范;(2)数据安全、爱国精神;(3)信息检索能力

02发展活动任务分析、任务资讯、任务实施

子任务1评论评分与城市的关系分析(面积图)任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,根据评论评分字段scores和城市名称字段citys数据统计出不同评分及对应城市的评论数量。根据统计出的不同评分及对应城市的评论数量,取出前五名城市的数据,使用Matplotlib绘制折线图和面积图,要求横轴为评分,纵轴为评论数量,显示不同评分、不同城市的评论数据变化趋势。

1.面积图任务资讯面积图对轴和线之间的区域着色,不仅能够强调峰和谷,还能够强调高点和低点的持续时间。高点持续时间越长,线下面积越大。pyplot模块可以使用fill_between()函数和stackplot()函数绘制面积图。fill_between()函数语法格式如下:

1.面积图任务资讯stackplot()函数语法格式如下

1.面积图任务资讯示例:显示A类产品2022年和2021年季度销售情况,通过fill_between()函数绘制面积图,代码如下:以上代码设置alpha为0.5(半透明),同时绘制了两条折线图,能显示出面积图的上边缘,运行结果如图1-3-2所示

1.面积图任务资讯示例::显示A类产品2022年和2021年季度销售情况,通过stackplot()函数绘制堆叠面积图,代码如下:以上代码绘制了一个堆叠面积图,堆叠面积图有两个颜色的面积,分别对应2022年和2021年的销售情况,运行结果如图1-3-3所示。

任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图常用参数值。步骤2:统计不同评分各城市的评分数量。根据处理评分字段scores和城市名称字段citys数据,统计不同评分及对应城市的评分数量,取出评论数量最多的五个城市的数据用于绘图步骤3:绘制折线图和面积图。绘制5条折线图和5个面积图,横轴为评分,纵轴为评论数量,显示不同评分、不同城市的评论数据变化趋势。

子任务2评论评分好评与差评的关键信息分析任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,根据评论评分字段scores,按照好评差评标准进行分类。对分类的数据做jieba分词后使用WordCloud()绘制好评和差评留言的词云图,显示好评和差评关键字信息。

1.词云图任务资讯词云图,也叫文字云,即对输入的一段文字计算词汇出现的频率(词频),然后根据词频集中显示高频词,简洁、直观、高效。词云图使人们可以快速感知最突出的文字,迅速抓住重点,了解主旨。制作词云图的方法有很多,可以借助第三方网站的在线词云图工具,也可以基于Python。这里使用WordCloud制作词云图,制作流程如下:1)准备一段文字。2)使用jieba分词。3)准备停用词。4)WordCloud生成词云图示例:简单分词,代码如下:

1.词云图任务资讯示例:制作朱自清《春》的词云图

1.词云图任务资讯修改示例:制作朱自清《春》的词云图

任务实施步骤:步骤1:初始工作。导入相关包,设置Matplotlib绘图常用参数值。步骤2:准备停用词。定义stop_words()函数,读

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档