自然语言及语音处理项目式教程 实训指导 实训10 文本依存句法分析.docx

自然语言及语音处理项目式教程 实训指导 实训10 文本依存句法分析.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《自然语言处理技术》

PAGE2

《自然语言处理技术》

PAGE2

深入文本进阶处理

——文本依存句法分析

实训目标

掌握句法分析的大致流程。

熟练使用HanLP库的parseDependency函数对依存句法关系进行展示。

实训环境

环境

版本

说明

Windows10

64

电脑操作系统

Python

3.8.5

Python语言版本

pandas

1.3.0

主要用于数据读取、清洗等操作

NumPy

1.21.6

主要用于Python中的数值计算

jieba

0.42.1

主要用于文本分词

Gensim

4.2.0

主要用于检索文本、计算文本相似度、训练词向量、建模主题等

Matplotlib

3.3.0

主要用于数据可视化

PaddlePaddle

2.4.2

是一个深度学习框架,提供了高效的计算框架和优化算法

PaddleSpeech

1.2.0

主要用于语音和音频中的各种关键任务的开发

scikit-learn

1.0.2

广泛地用于统计分析和机器学习建模等数据科学领域

Librosa

0.8.1

主要用于分析一般的音频信号,是一个非常强大的Python语音信号处理的第三方库

NLTK

3.5

是一个常用的自然语言处理工具包,可用于文本处理、语义分析、词性标注等

SciPy

1.7.3

是一个科学计算工具包,可用于数学、科学、工程学等领域

pyttsx3

2.9.0

主要用于将文本转换成语音

实训说明

文本依存句法分析是自然语言处理中的一项任务,旨在识别句子中单词之间的依赖关系,并构建句子的依赖关系树。在本任务中,需要找出句子中的主谓关系、动宾关系、修饰关系等,以及词语之间的关系,从而更好地理解句子的语义。

文本依存句法分析的基本流程如REF_Ref131447850\h图31所示。

图STYLEREF1\s3SEQ图\*ARABIC\s11文本依存句法分析的基本流程

实训步骤

文本依存句法分析运用HanLP库的parseDependency函数对输入语句的依存句法关系进行展示,如REF_Ref131518358\h代码31所示。

代码STYLEREF1\s3SEQ代码\*ARABIC\s11依存句法关系展示

frompyhanlpimport*

print(HanLP.parseDependency(实施乡村振兴战略,要坚持党管农村工作,坚持农业农村优先发展,坚持农民主体地位,坚持乡村全面振兴,坚持城乡融合发展,坚持人与自然和谐共生,坚持因地制宜、循序渐进。))

运行REF_Ref131518358\h代码31,得到文本依存句法关系展示结果如下。

1实施实施vv_0核心关系__

2乡村乡村nn_4定中关系__

3振兴振兴vv_4定中关系__

4战略战略nn_1动宾关系__

5,,wpw_1标点符号__

6要要vv_7状中结构__

7坚持坚持vv_1并列关系__

8党党nn_9主谓关系__

9管管vv_7动宾关系__

10农村农村nn_9动宾关系__

40、、wpw_41标点符号__

41循序渐进循序渐进

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档