Python数据可视化分析与案例实战 第10章 文本数据的可视化.pptVIP

  • 119
  • 0
  • 约2.11千字
  • 约 17页
  • 2022-05-03 发布于甘肃
  • 举报

Python数据可视化分析与案例实战 第10章 文本数据的可视化.ppt

* Python数据可视化分析与案例实战 * Python数据可视化分析与案例实战 第10章 文本数据的可视化 目录 1 标签云法 文本数据概述 2 词云法 3 主题河流图法 4 文档散法 5 文本数据是指不能参与算术运算的任何字符,也称为字符型数据。如英文字母、汉字、不作为数值使用的数字(单引号开头)和其他可输入的字符。 文本数据不同于传统数据库中的数据,它具有半结构化、高维度、数据量大、语义性等4个方面的特点。 10.1.1 文本数据简介 文本可视化可以帮助我们理解、组织、比较和关联文本,能够更快的告诉我们文本在讲什么。例如,对于社交网络上的发言,文本可视化可以帮我们信息归类;对于新闻事件,文本可视化可以帮我们整理清楚事情的发展脉络、每个人物的关系等;对于一系列的文档,我们可以通过文本可视化来找到它们之间的联系等。 10.1.2 文本数据的可视化 目录 1 标签云法 文本数据概述 2 词云法 3 主题河流图法 4 文档散法 5 标签云是一种关键词的可视化方法,用于汇总生成的标签或文字内容。标签一般是独立的词汇,常常按顺序排列,其重要程度又能通过改变字体大小或颜色来表现,所以标签云可以灵活地依照字序或热门程度来检索标签。 当需要对文本中的某些词进行重点突出说明时,例如,马丁·路德·金于1963年8月28日在华盛顿林肯纪念堂发表的著名的《我有一个梦想》演讲的英文文本的标

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档