项目12 熟悉常用的标准库和第三方库.pptxVIP

  • 0
  • 0
  • 约1.88千字
  • 约 25页
  • 2026-02-04 发布于湖南
  • 举报

项目12 熟悉常用的标准库和第三方库.pptx

12;;Python有一套很有用的标准库(StandardLibrary),它是Python的重要组成部分。Python语言的核心只包含数字、字符串、列表、字典、文件等常见类型和函数,而由Python标准库提供了系统管理、网络通信、文本处理、数据库接口、图形系统、XML处理等额外的功能。当安装Python解释器时,标准库会随其被安装。Python标准库命名接口清晰、文档良好,很容易学习和使用,同时可以让编程事半功倍,是程序开发的利器。;任务1Python的标准库;任务1Python的标准库;任务1Python的标准库;任务1Python的标准库;(2)seed()函数。

Python中的随机数需要使用随机数种子来产生;随机数种子确定,产生的随机序列(每一个数,每个数之间的关系)也就确定。随机数种子函数为random.seed(a),默认参数a等于当前系统时间。如果参数a值固定,则随之产生的随机数也会是同一个值(简而言之就是对random库里面产生“随机数”的函数定了一个标准参数)。如果参数a值不固定,生成的随机数不一样。;任务1Python的标准库;【例12.5】使用random库实现简单的微信红包分配。;任务1Python的标准库;时间日期格式化符号,在Python中会使用到一些特殊的符号来格式化时间日期,类似于字符串格式化中的“%s”“%d”等。;库函数;;任务2Python的第三方库;1)jieba库的安装

(1)使用基本命令自动安装。

pipinstalljieba

(2)使用清华源的镜像快速安装。

pipinstalljieba–i/simple/;2)jieba库的使用

jieba分词有3种模式。

(1)精确模式。把一段文本精确地切分成若干个中文单词,若干个中文单词之间经过组合,就精确地还原为之前的文本,其中不存在冗余单词,返回结果是列表类型。

(2)全模式。将一段文本中所有可能的词语都扫描出来,可能有一段文本它可以切分成不同的模式,或者有不同的角度来切分变成不同的词语,在全模式下,jieba库会将各种不同的组合都挖掘出来。分词后的信息再组合起来会有冗余且冗余性最大,不再是原来的文本。

(3)搜索引擎模式。在精确模式基础上,对发现的那些长的词语,会对它再次切分,进而适合搜索引擎对短词语的索引和搜索,也有??余。

从三种模式对同一字符串语句运行结果可以发现,精确模式试图将句子最精确地分开,适合文本分析;全模式把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;搜索引擎模式在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。

;jieba库常用的函数及其功能描述;3)jieba库词库的添加与删除

在jieba库中,词库是指用于分词的词典,jieba库提供了内置的词典和用户自定义的词典。用户可以通过添加或删除词语来定制自己的词典。其内置的词典在jieba安装默认文件夹jieba中的dict.txt文件。

(1)添加单个词语。

在jieba库中,可以通过调用add_word(word,freq=None,tag=None)方法来向词库中添加单个词语。其中,word为需要添加的词语,freq为该词语的词频,tag为该词语的词性。

(2)添加自定义词典。

当需要添加的词过多时,建议使用添加词典的方式。自定义词可以包含用户自己添加的词语及其词频和词性等信息。

(3)词库的删除。

在jieba中,可以通过调用del_word(word)方法来删除词库中的单个词语。其中,word为需要删除的词语。

;2.wordcloud库;1)wordcloud库的安装

(1)使用基本命令自动安装。

pipinstallwordcloud

(2)使用清华源的镜像快速安装。

pipinstallwordcloud–i/simple/;2)wordcloud库的使用

(1)WordCloud类解析。

wordcloud库的核心是WordCloud类,所有的功能都封装在WordCloud类中,使用时需要实例化一个WordCloud类的对象。使用wordcloud.WordCloud(参数)方法可以创建WordCloud对象(注意字母大小写)。;【例12.18】使用英文文本生成词云。;;感谢观看

文档评论(0)

1亿VIP精品文档

相关文档