大数据治理(高级) 课件 西财 实训项目7:电影数据可视化.pptx

大数据治理(高级) 课件 西财 实训项目7:电影数据可视化.pptx

实训7电影数据可视化

项目背景实训目标技术准备实训任务实训步骤目录

项目背景当今,人们的生活需求越来越高,电影在经济发展中起到了不可忽视的作用,利用已有的数据分析出人们对电影的需求,能够更好的提高电影事业的进一步发展。本章节的目的主要是利用已有的每天电影播放情况、票房数据等信息进行分析,使用可视化的形式进行分析,主要目的分析电影中哪些电影的播放次数较多,哪些电影的总票房较高以及电影趋势信息等,并使用各类图表进行展示。

实训目标?掌握日期数据的处理;?掌握可视化图表的使用;?掌握词云图的简单应用。

技术准备词云图词云图可以把带权重的关键词渲染成词云,下面介绍用wrodcloud模块来生成词云。安装:打开AnacondaPrompt,选择开始菜单--Anaconda3--AnacondaPrompt。直接使用pipinstallwordcloud进行包的安装。

技术准备WordCloud的使用介绍Wordcloud的方法及用法描述方法用法描述W.generate(text)WordCloud对象w中加载文本text如w.generate(text)W.to_file(filename)将词云输出为图像文件,.png或.jpg格式w.to_file(“filename.jpg”)

技术准备参数及其用法描述参数用法描述Width指定WordCloud对象生成图片的宽度,默认400像素Height指定WordCloud对象生成图片的高度,默认200像素Min_font_size指定词云中字体最小字号,默认4号Max_font_size指定词云中字体最大字号,根据高度调节Font_step指定词云中字体字号的步进间隔,默认为1Font_path指定词云文件路径,默认NoneMax_words指定词云显示的最大单词数量,默认200stop_words指定词云的排除词列表,即不显示的单词列表Mask指定词云形状,默认为长方形,需要引入imread()函数Background_color指定词云图片的背景颜色,默认为黑色

实训任务(1)电影的总场次高低可视化;(2)电影的总票房高低可视化;(3)数据的票房趋势可视化;(4)使用词云图分析热播电影。

任务步骤见参考文档

感谢聆听

文档评论(0)

1亿VIP精品文档

相关文档