运用wordcloud库和jieba库制作中文词云 教学课件.pptx

运用wordcloud库和jieba库制作中文词云 教学课件.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

文字处理与展示(2)运用wordcloud库和jieba库制作中文词云

中文词云英文词云如何制作中文词云?将文本内容换为中文就可以吗?

任务一1、运行“程序活动”程序2、查看词云结果

wordcloud默认字体是不支持中文设置中文字体英文直接换中文问题1

font_path字体路径w=wordcloud.WordCloud(font_path=“中文字体”)如何查看电脑系统里的字体设置中文字体配置词云对象参数如果是电脑系统里的字体,可以不需要将字体文件放在和程序同一目录下如果系统没有字体,则需要将字体文件和程序放在同一目录下

利用如下字体文件,配置中文字体参数w=wordcloud.WordCloud(font_path=“字体名称.ttf”)任务二

找不同?句子词语关键词问题2

英语每个单词之间有空格中文的每个词没有分你们的时间是有限的中文需要分词,分成词语发现规律

jieba库英文单词之间是以空格作为自然分界符的中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符要制作中文词云,需要先进行中文分词jieba是一个中文分词库,它使用的是基于统计的分词方法。jieba库

安装jieba库与安装其他第三方库的方法一样,打开海龟编辑器→选择菜单栏中的库管理→搜索jieba库→单击“安装”。jieba库的安装

步骤1:导入jieba库importjieba今天下雨今天下雨今天下雨今天下雨今天下雨jieba库的使用步骤

分词模式核心代码(S为字符串或字符串变量)代码精确模式jieba.cut(S)cut_all参数默认为false最精确地切开,适合文本分析全模式jieba.cut(S,cut_all=True)速度快,但不能解决歧义搜索引擎模式jieba.cut_for_search(S)在精确模式基础上对长词再切分,提高召回率,适用于搜索引擎分词S=我想考上清华大学jieba库的使用步骤

“”.join(S)如何将分好的词语统一分开呢?我想考上清华大学步骤3:添加连接符连接符(空格、逗号等)我,想,考上,清华大学jieba库的使用步骤

步骤1:导入jieba库importjieba步骤2:分词s=jieba.cut(txt)步骤3:添加连接符tt=“”.join(s)步骤1:导入jieba库importjieba步骤2:分词并添加连接符tt=“”.join(jieba.cut(txt))加载词云文本w.generate(tt)jieba库的使用步骤

对文本先进行精确模式分词并添加连接符“”.join(jieba.cut(s))分词连接符任务三

修改中文词云形状课后作业参数描述方法mask词云形状(默认为长方形)需引用函数读取图片文件里的数据方法一:fromPILimportImageimportnumpyasnpmk=np.array(Image.open(“pic.jpg”))w=wordcloud.WordCloud(mask=mk)方法二:fromscipy.miscimportimreadmk=imread(“pic.jpg”)w=wordcloud.WordCloud(mask=mk)

谢谢观看

文档评论(0)

专注于方案的个性定制,修改,润色,PPT定制、设计,本人已有5年相关工作经验,具有扎实的方案及设计功底,可接演讲稿,读后感,PPT定制等多方面工作,欢迎咨询

1亿VIP精品文档

相关文档