- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE2
PAGE2
PAGE11
PAGE11
课题
文本型数据可视化
课时
2课时(90min)
教学目标
知识目标:
(1)了解文本型数据的概念及应用场景。
(2)了解词云图、树状图和关系图的概念及应用。
(3)掌握使用pyecharts绘制词云图、树状图和关系图的方法。
技能目标:
能使用词云图、树状图和关系图对文本型数据进行可视化和分析。
素养目标:
(1)学会正视问题,增强不畏困难、迎难而上的勇气。
(2)培养创新意识,提升新一代信息技术应用能力。
教学重难点
教学重点:文本型数据的概念及应用场景,词云图、树状图和关系图的概念及应用,使用pyecharts绘制词云图、树状图和关系图的方法
教学难点:能使用词云图、树状图和关系图对文本型数据进行可视化和分析
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材
教学过程
主要教学内容及步骤
考勤
【教师】使用文旌课堂APP进行签到
【学生】班干部报请假人员及原因
问题导入
【教师】扫码播放“常用的文本型数据分析方法”视频(详见教材),帮助学生了解常用的文本型数据分析方法,并提出问题:
问题1:列举常用的文本型数据分析方法。
问题2:如果想要了解文本中各个词语的重要程度和使用频率,通常使用什么分析方法?
【学生】分组、观看、思考、讨论、举手回答
传授新知
【教师】通过学生的回答引入要讲的知识,讲解文本型数据的概念及应用场景,词云图、树状图和关系图的概念及应用,以及使用pyecharts绘制词云图、树状图和关系图的方法等知识
8.1什么是文本型数据
文本型数据是指以文本形式存在的数据,包括文档、文章、报告、电子邮件、社交媒体帖子、网页内容等。与数值型数据相比,文本型数据具有多样性、主观性、非结构化等特点,并且往往涉及语义、语法、上下文等,因此在处理和分析上具有一定的难度。
常用的文本型数据分析方法有词频分析、结构分析、主题分析、关系分析等。将这些分析方法与可视化技术相结合,可以将文本型数据转化为可视化图表,帮助用户更好地挖掘和利用数据中的信息。文本型数据可视化常用的图表有词云图、树状图和关系图。
8.2词云图
词云图是一种用不同的字体和颜色展示文本型数据中词语的出现频率和重要性的图表。一般情况下,词语的字体越大,颜色越深,则在文本数据中的出现频率越高,越重要。
词云图简洁明了、易于理解,可以帮助用户快速了解文本数据的主题和重点,常用于舆情分析、商品评价分析、品牌宣传等。
?【例8-1】
?【教师】通过多媒体展示“‘某电商平台某款连衣裙的商品评价.xlsx’文件中的数据(部分)”图片,并提出问题:
使用词云图实现某电商平台某款连衣裙的商品评价可视化。
?【学生】聆听、思考、写代码、举手回答
?【教师】总结学生的回答
【问题分析】
本案例基于“某电商平台某款连衣裙的商品评价.txt”文件中的数据,使用pyecharts的WordCloud类绘制词云图。首先安装jieba库并导入;然后读取文本内容,并使用jieba的lcut()函数对文本内容进行分词;接着将排除单个字符的分词结果添加到字典中(键为词语,值为词语出现频率);最后绘制词云图,添加数据时设置词语字体大小范围(word_size_range)和词云图轮廓(shape)。
【参考代码】
#导入pyecharts库中的options模块
frompyechartsimportoptionsasopts
#导入pyecharts库中charts模块的WordCloud类
frompyecharts.chartsimportWordCloud
importjieba#导入jieba库
#以只读模式打开文件并读取文件内容
withopen(某电商平台某款连衣裙的商品评价.txt,r)asfile:
text=file.read()
words=jieba.lcut(text)#对文本内容进行分词,将结果赋给words
word_counts={}#定义字典,用于存储词语及其出现频率
forwordinwords:#遍历words
iflen(word)1:#排除分词结果中的单个字符
#词语出现频率累加
word_counts[word]=word_counts.get(word,0)+1
#创建W
您可能关注的文档
- 《Python数据可视化案例教程》教案 项目4 分布型数据可视化.docx
- 《Python数据可视化案例教程》教案 项目5 关联型数据可视化.docx
- 《Python数据可视化案例教程》教案 项目6 比例型数据可视化.docx
- 《Python数据可视化案例教程》教案 项目7 时间型数据可视化.docx
- 《Python数据可视化案例教程》教案 项目9 地理空间型数据可视化.docx
- 《Python数据可视化案例教程》教案 项目10 点评网站美食店铺数据可视化.docx
- 《Hive数据仓库技术与应用案例教程》教案 项目1 数据仓库与Hive.docx
- 《Hive数据仓库技术与应用案例教程》教案 项目2 Hive基础.docx
- 基于springboot和vuejs的在线考试系统的设计与实现.doc
- 关于强化企业会计监督的思考.doc
文档评论(0)