机器语音语言应用技术-文本情感倾向分析.docxVIP

机器语音语言应用技术-文本情感倾向分析.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

实验9文本情感倾向分析

一、实验目的

1.熟悉中文情感分析的技术原理和应用。

2.基于情感词典的中文情感分析操作过程。

二、实验内容

1.算法原理

1.1基本描述

本实验文本情感倾向分析采用情感词典情感分析来实现,通过情感打分的方式进行文本情感极性判断,不同程度词赋值权值,否定词取反性情感,综合比较不同极性分数。

文本情感分析(SentimentAnalysis,SA),又称倾向性分析、意见抽取(Opinionextraction)、意见挖掘(Opinionmining)、情感挖掘(Sentimentmining)、主观分析(Subjectivityanalysis),是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。

文本情感分析的目的是为了找出说话者/作者在某些话题上或者针对一个文本两极观点的态度。这个态度或许是他或她的个人判断或是评估,也许是他当时的情感状态(就是说,作者在做出这个言论时的情绪状态),或是作者有意向的情感交流(就是作者想要读者所体验的情绪)。文本情感分析的应用非常广泛,如网络舆情风险分析,信息预测等。例如通过Twitter用户情感预测股票走势、电影票房、选举结果等,均是将公众情绪与社会事件对比,发现一致性,并用于预测。

1.2专业术语

按照处理文本的粒度不同,文本情感分析大致可分为篇章级、句子级、词语级三个研究层次:

1)篇章级情感分析:

篇章级别的情感分类是指定一个整体的情绪方向/极性,即确定该文章(例如,完整的在线评论)是否传达总体正面或负面的意见。在这种背景下,这是一个二元分类任务。它也可以是回归任务,例如,从1到5星的审查推断的总体评分。也可以认为这是一次5级分类任务。

我们可以将自然语言处理技术与模糊逻辑技术相结合,基于手动创建的模糊情感词典,对新闻故事和电影评论进行情感分析。定义情感种类,在模糊情感词典中标注情感类别及其强度。每个词语可以属于多个情感类别。在实验中,可以对比采用词频、与长度相关的特征、语义倾向、情感PMI—IR、强调词和特殊符号等不同特征时的结果。最后对文章的主动性/被动性和积极/消极性进行了判断。

2)句子级情感分析:

由于句子的情感分析离不开构成句子的词语的情感,其方法划分为三大类:基于知识库的分析方法、基于网络的分析方法、基于语料库的分析方法。

我们在对文本信息中句子的情感进行识别时,通常创建的情感数据库会包含一些情感符号、缩写、情感词、修饰词等等。我们在具体的实验中会定义几种情感(生气、憎恨、害怕、内疚、感兴趣、高兴、

悲伤等),对句子标注其中一种情感类别及其强度值来实现对句子的情感分类。

3)词语级情感分析:

词语的情感是句子或篇章级情感分析的基础。早期的文本情感分析主要集中在对文本正负极性的判断。词语的情感分析方法主要可归纳为三类:

a)基于词典的分析方法。

基于词典的分析方法利用词典中的近义、反义关系以及词典的结构层次,计算词语与正、负极性种子词汇之间的语义相似度,根据语义的远近对词语的情感进行分类。

b)基于网络的分析方法。

基于网络的分析方法利用万维网的搜索引擎获取查询的统计信息,计算词语与正、负极性种子词汇之间的语义关联度,从而对词语的情感进行分类。

c)基于语料库的分析方法。

基于语料库的分析方法,运用机器学习的相关技术对词语的情感进行分类。机器学习的方法通常需要先让分类模型学习训练数据中的规律,然后用训练好的模型对测试数据进行预测

2.功能设计

2.1功能描述

AiNLP人工智能轻量化应用框架是一款面向于人工智能自然语言应用的开发框架,采用统一模型调用、统一硬件接口、统一算法封装和统一应用模板的设计模式,实现了嵌入式边缘计算环境下进行快

速的应用开发和项目实施。

AiNLP为模型算法的调用提供RESTful调用接口,实时返回自然语言算法处理结果,同时通过物联网云平台的应用接口,实现与硬件的连接和互动,最终形成各色智联网产业应用。

AiNLP框架如下图所示:

三、实验步骤

1.工程部署

1.1硬件部署

1)准备人工智能边缘应用平台,给边缘计算网关正确连接Wi-Fi天线、电源。

2)按下电源开关上电启动边缘计算网关,将启动ubuntu操作系统。

3)系统启动后,连接局域网内的Wi-Fi网络,记录边缘计算网关的IP地址

1.2工程部署

1)运行MobaXterm工具,通过SSH登录到边缘计算网关(参考附录2)。

2)在SSH终端创建实验工作目录:

$mkdir-p~/ainlp-exp

3)通过SSH将本实验工程代码和ainlp工程包(DISK-AILab\02-软件资料

文档评论(0)

中智讯 + 关注
官方认证
服务提供商

中智讯(武汉)科技有限公司,是一家服务于高校信息类新工科教育解决方案的高新技术企业,公司自创立以来一直致力于工科教育解决方案及高校科研协作,始终坚持以“易教,易学,易研,易用”为企业产品定位,以“踏实做事,诚信做人”的经营理念为立业之本,并形成了一套完整的从教学设备、教学教材、师资培训、专家授课、科研合作的综合性教育解决方案体系。

认证主体中智讯(武汉)科技有限公司
IP属地湖北
统一社会信用代码/组织机构代码
914201110591757379

1亿VIP精品文档

相关文档