电子教案设计-第10章-Python第三方库概览.pptVIP

电子教案设计-第10章-Python第三方库概览.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
jieba.lcut(s, cut_all = True)用于全模式,即将字符串的所有分词可能均列出来,返回结果是列表类型,冗余性最大。 jieba库与中文分词 import jieba ls = jieba.lcut(全国计算机等级考试Python科目, cut_all=True) print(ls) [全国, 国计, 计算, 计算机, 算机, 等级, 考试, Python, 科目] jieba.lcut_for_search(s)返回搜索引擎模式,该模式首先执行精确模式,然后再对其中长词进一步切分获得最终结果。 jieba库与中文分词 import jieba ls = jieba.lcut_for_search(全国计算机等级考试Python科目) print(ls) [全国, 计算, 算机, 计算机, 等级, 考试, Python, 科目] 搜索引擎模式更倾向于寻找短词语,这种方式具有一定冗余度,但冗余度相比全模式较少。 如果希望对文本准确分词,不产生冗余,只能选择jieba.lcut(s)函数,即精确模式。如果希望对文本分词更准确,不漏掉任何可能的分词结果,请选用全模式。如果没想好怎么用,可以使用搜索引擎模式。 jieba库与中文分词 jieba.add_word()函数,顾名思义,用来向jieba词库增加新的单词。 jieba库与中文分词 import jieba jieba.add_word(Python科目) ls = jieba.lcut(全国计算机等级考试Python科目) print(ls) [全国, 计算机, 等级, 考试, Python科目] wordcloud库概述 词云以词语为基本单元,根据其在文本中出现的频率设计不同大小以形成视觉上不同效果,形成“关键词云层”或“关键词渲染”,从而使读者只要“一瞥”即可领略文本的主旨。 wordcloud库概述 wordcloud库是专门用于根据文本生成词云的Python第三方库,十分常用且有趣。 装wordcloud库在Windows的cmd命令行使用如下命令: wordcloud库概述 :\pip install wordcloud wordcloud库的使用十分简单,以一个字符串为例。其中,产生词云只需要一行语句,在第三行,并可以将词云保存为图片。 wordcloud库概述 from wordcloud import WordCloud txt=I like python. I am learning python wordcloud = WordCloud().generate(txt) wordcloud.to_file(testcloud.png) wordcloud.wordcloud.WordCloud object at 0x000001583E26D208 wordcloud库与可视化词云 在生成词云时,wordcloud默认会以空格或标点为分隔符对目标文本进行分词处理。对于中文文本,分词处理需要由用户来完成。一般步骤是先将文本分词处理,然后以空格拼接,再调用wordcloud库函数。 wordcloud库与可视化词云 wordcloud库与可视化词云 ? ? 1 2 3 4 5 6 7 8 9 import jieba from wordcloud import WordCloud txt = 程序设计语言是计算机能够理解和识别用户操作意图的一种交互体系,它按照特定规则组织计算机指令,使计算机能够自动进行各种运算处理。 words = jieba.lcut(txt) # 精确分词 newtxt = .join(words) # 空格拼接 wordcloud = WordCloud(font_path=msyh.ttc).generate(newtxt) wordcloud.to_file(词云中文例子图.png) # 保存图片 ? ? wordcloud库的核心是WordColoud类,所有的功能都封装在WordCloud类中。使用时需要实例化一个WordColoud类的对象,并调用其generate(text)方法将text文本转化为词云。 wordcloud库与可视化词云 WordCloud对象创建的常用参数 wordcloud库与可视化词云 参数 功能 font_path 指定字体文件的完整路径,默认None width 生成图片宽度,默认400像素 height 生成图片高度,默认200像素 mask 词云形状,默认None,即,方形图 min_font_size 词云中最小的字体字号,默认4号 font_step 字号步进间隔,默认1 min_font_size 词云中最大的字体字号,默

文档评论(0)

jyr0221 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档