- 4
- 0
- 约1.03万字
- 约 43页
- 2021-09-13 发布于江苏
- 举报
of
56
1
9.1 Python常用自然语言处理工具
第九章 自然语言处理
of
31
2
9.1.1 Python自然语言处理工具包NLTK
自然语言处理工具包NLTK是NLP领域最常使用的一个Python库。NLTK是由美国宾夕法尼亚大学的Steven Bird和Edward Loper开发的。NLTK包括图形演示和示例数据,其提供了WordNet这种方便处理词汇资源的接口,以及分类、分词、词干提取、标注、语法分析、语义推理等类库。
NLTK网站:/。
安装NLTK的命令:sudo pip install -U nltk。
安装NumPy的命令(可选):sudo pip install -U numpy。
安装测试的命令:python then type import nltk。
9.1 Python常用自然语言处理工具
第九章 自然语言处理
of
31
3
9.1.2 Python中文处理工具jieba
jieba是一个用Python实现的分词库,对中文有很强大的分词能力。
jieba网站:/fxsjy/jieba。
Windows环境下安装jieba的命令:pip install jieba。
jieba的优点如下:
(1)支持3种分词模式:
精确模式。试图将句子最精确地切开,适合文本分析。
全模式。把句子中所有可以成词的词语都扫描出来, 速度非常快,但是不
您可能关注的文档
- Python程序设计与大数据 第1章 Python基础.pptx
- Python程序设计与大数据 第2章 数据类型.ppt
- Python程序设计与大数据 第2章 数据类型.pptx
- Python程序设计与大数据 第4章 程序控制.pptx
- Python程序设计与大数据 第6章 连接数据源.pptx
- Python程序设计与大数据 第7章 网络爬虫.pptx
- Python程序设计与大数据 第8章 数据挖掘.pptx
- Python程序设计与大数据 第12章 与云结合.pptx
- PythonWeb开发基础教程 第6章 模板.pptx
- PowerBI数据分析与数据可视化-教案.doc
- 清明节高中下学期主题班会课件.pptx
- 统编版语文一年级下册课件《语文园地三》.pptx
- 统编版语文一年级下册课件《语文园地六》.pptx
- 一例ECMO术患者的个案护理.pptx
- 2.12 辽宋夏金元时期经济的繁荣 课件 2025-2026学年统编版七年级历史下学期.pptx
- 一例重症肺炎患者改善肺功能的循证个案护理.pptx
- 青春不“翻车”:电动车安全小贴士 高中下学期主题班会.pptx
- 主动脉夹层破裂的急救护理.pptx
- Unit 3 My school calendar Part A let's spell 课件(内嵌音视频)2025-2026学年人教PEP版英语五年级下册.pptx
- 乳糜尿的微生物学分析.pptx
原创力文档

文档评论(0)