Python程序设计与大数据 第9章 自然语言处理.pptxVIP

  • 4
  • 0
  • 约1.03万字
  • 约 43页
  • 2021-09-13 发布于江苏
  • 举报

Python程序设计与大数据 第9章 自然语言处理.pptx

of 56 1 9.1 Python常用自然语言处理工具 第九章 自然语言处理 of 31 2 9.1.1 Python自然语言处理工具包NLTK 自然语言处理工具包NLTK是NLP领域最常使用的一个Python库。NLTK是由美国宾夕法尼亚大学的Steven Bird和Edward Loper开发的。NLTK包括图形演示和示例数据,其提供了WordNet这种方便处理词汇资源的接口,以及分类、分词、词干提取、标注、语法分析、语义推理等类库。 NLTK网站:/。 安装NLTK的命令:sudo pip install -U nltk。 安装NumPy的命令(可选):sudo pip install -U numpy。 安装测试的命令:python then type import nltk。 9.1 Python常用自然语言处理工具 第九章 自然语言处理 of 31 3 9.1.2 Python中文处理工具jieba jieba是一个用Python实现的分词库,对中文有很强大的分词能力。 jieba网站:/fxsjy/jieba。 Windows环境下安装jieba的命令:pip install jieba。 jieba的优点如下: (1)支持3种分词模式:  精确模式。试图将句子最精确地切开,适合文本分析。  全模式。把句子中所有可以成词的词语都扫描出来, 速度非常快,但是不

文档评论(0)

1亿VIP精品文档

相关文档