- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据的消防产品评价系统.doc
基于大数据的消防产品评价系统
摘 要 目前,大数据的应用已经渗透到各个领域,但在消防部队仍处于初级阶段,如何有效应用大数据技术为消防部队服务,利用现有的海量数据和自然语言处理技术,建立有效的关系模型,分析现有数据之间存在的关系,预测未来事物的发展趋势,为消防灭火救援、消防防火执法、消防部队管理、消防装备采购等方面提供辅助决策。在这篇文章中研究和讨论是利用计算机自然语言处理技术对相关消防产品的海量评论数据进行挖掘,判断出这些评价信息的褒贬倾向和强度。经过测试,正确率可达到89%,如果抛除一些无倾向性的信息,正确率可达到94.5%。
关键词 消防;大数据;自然语言处理;辅助决策;褒贬倾向和强度
中图分类号 F4 文献标识码 A 文章编号 1674-6708(2016)170-0070-02
随着网络数据的不断增加,在网络上关于消防产品的信息也不断增多。大数据的处理在消防上的应用也越来越广泛。一些消防类产品会有成百上千的评论文章,在这些评论中会有用户对相关消防产品的评价信息。当用户在了解某个消防产品或者厂家需要了解需求的时候,这些信息就显得尤为重要。但面对这些海量的信息,如果使用人工阅读和判断就显得较为困难,会耗费大量的人力和物力,也很难做出准确的决定。面对这些问题,利用计算机处理海量数据的优势,对评价信息做出判断是最方便快捷的应用。在这篇文章中研究和讨论是利用计算机自然语言处理技术对相关消防产品的海量评论数据进行挖掘,判断出这些评价信息的褒贬倾向和强度。经过测试,正确率可达到89%,如果抛除一些无倾向性的信息,正确率可达到94.5%。
1 相关资源的建立
在对相关产品进行评价之前,需要建立相关的基础资源,如影响元素数据表、组合元素、产品数据表、词义倾向性数据表、相关特征数据、清除元素、特殊元素等等。
1.1 影响元素数据表
一段评论或文章中的某些词本身并不具有褒贬倾向性的意义,但是它对句子的褒贬程度会产生一定的影响力,例如程度副词或否定副词等词语,起到了增强、减弱和否定等作用,在此我们会对这些元素用不同的符号进行标注表示不同的影响程度。
一些影响元素需要和褒贬词有一定的间隔限制才会影响到句子的褒贬程度。例如,“AT消防车外部的电子液位显示器绝对是为了让消防员更便捷的掌握消防车液位量而设计的。”其中“便捷”是对AT消防车的评价,但影响元素“绝对”并不能增强评论人员对AT消防车的感情色彩。我们规定影响元素必须与褒贬词紧邻或者之间由“那么、这么、是、得”等词间隔时才会起作用。
还存在一些情况,如“一七消防车的器材箱门没有一丝的瑕疵”,“瑕疵”是贬义的,加上了“没有”就起到了否定的作用。
1.2 组合元素
一些词语虽然本身并没有什么意义,但如果与另一些词搭配使用时就会带有倾向性的意义,例如“性价比高”“噪声低”,其中“高”“低”本身无褒贬性,但与前面的词语搭配使用就具有了褒贬性。
1.3 产品数据表
本文研究的主要是对一些消防产品进行评价,被评价的消防产品就是产品数据。例如一七消防车、大力水泵、海洋王头灯等。系统分析一个品牌消防产品的不同形式的全部信息,即将一个产品的所有相关信息都映射到它本身。
1.4 词义倾向性数据表
一个信息的倾向性主要是由褒贬词决定的,对这些词汇的提取工作是最基础也是最重要的。可以根据词汇的褒贬程度再进行细分,可将其划分为加强褒、褒、加强贬和贬,用“+、-、*、~”来表示。
在判断一个词的褒贬倾向性的时候要考虑到领域、词性等因素,一个词放在某个句子时是褒义的,但放在另一个句子是可能就会是贬义的,因为我们研究的是基于消防产品的评价,所以我们只考虑在消防领域中的表达意义。当然也需要考虑词性的问题,当一个词为形容词时它可能表示的是贬义,但为动词时就表示褒义,所以这就需要利用自然语言处理的分词技术对语料进行提前的标注。
1.5 相关特征数据
相关特征数据即对每一个消防产品都有一个特征数据表,特征数据表的每一个信息都是该产品的一部分。例如一个4G图像传输设备的特征数据表中有电池、摄像头、连接线等等。
1.6 清除元素
一些词本身是有意义的,但如果与另一些词搭配使用就会失去意义,如“用这样的方法改装消防车是否成功有待在实战中进一步验证”,“成功”是褒义的,但与“是否”搭配后就失去了意义。所以我们会把这样的句子做清除处理。
1.7 特殊元素
一些词语与褒义词连用就会形成贬义,如“过”字的出现,对于这些组合我们也要考虑到并做出处理。
2 系统设计
2.1 功能
收集大量的消防产品评价信息,对其进行分词,并对相关产品及特征进行评价,给出详细的评分。
2.2 流程
您可能关注的文档
最近下载
- 信息系统等保安全方案.doc VIP
- 兴业银行信息技术专员岗位笔试选择题附笔试高分技巧.docx VIP
- 化工设计概论与化工制图课件第四章化工设备常用零部件简介.pptx VIP
- 高等教育5化工制图cad化工设备图中焊缝结构的表达.pptx VIP
- 化工设计概论与化工制图课件第七章车间布置设计.pptx VIP
- 新概念英语入门级6-10单元测试卷.pdf VIP
- 化工设计概论与化工制图课件第八章管道设计.pptx VIP
- 化工设计概论与化工制图课件第十章管道布置图.pptx VIP
- 化工制图cad8管道布置图.pptx VIP
- 统编版语文一年级下册2吃水不忘挖井人 课件(共54张PPT).pptx VIP
文档评论(0)