基于决策树的网络伪舆情识别研究.PDF

下载文档

43
0
约1.91万字
约 7页
2018-03-10 发布于天津
举报
保障服务

基于决策树的网络伪舆情识别研究.PDF

基于决策树的网络伪舆情识别研究

研究论文基于决策树的网络伪舆情识别研究赵静娴 (天津科技大学经济与管理学院天津 300222) 摘要: 【目的】针对舆情的识别问题, 提出一种基于组合优化决策树的伪舆情识别方法。【方法】在特征分析的基础上, 给出 A 、B 、C 三类伪舆情的定义。构建伪舆情评价指标体系, 并通过对评价指标离散化, 以归一输入输出关联值为属性选择标准建立决策树。【结果】基于Matlab 实现, 通过实验证明利用组合优化决策树所构建的伪舆情识别模型能够达到较高的预测准确率。【局限】模型和数据偏重固定网络媒介, 移动社交软件等新兴网络媒介的兴起可能改变伪舆情特征, 从而需要对方法做进一步改进。【结论】提供一种对多分类伪舆情进行智能识别的新方法。关键词: 伪舆情评价指标数据挖掘决策树分类号: G202 1 引言陈燕方等[6]提出一种基于评论产品属性情感倾向评估模型, 其共同特点是对文本语料进行低可信度的判随着信息技术、移动互联、智能手机等技术的发断。刘勘等[7]提出基于支持向量机的网络真伪舆情分展, 网络成为大众舆情的主要载体并以前所未有的深类模型, 采用多项式核函数以及优化之后的径向基核度、广度和速度影响着人们生活的各个方面。网络舆函数产生的分类器, 预测准确率高, 但该文只是笼统情不仅是人们对某些事件、话题、观点的反应, 同时地将舆情分为真舆情与伪舆情, 有关伪舆情的严格界也对人们的思想和行为有着巨大的影响和反作用。伪定并没有提及。而实际上事件观点本身的真伪和舆情舆情利用网络的影响力和人们的从众心理, 掀起网络谣言, 歪曲事实真相, 混淆视听, 对正常的网络生活形成过程的真伪都会对舆情的真伪造成影响, 进一步造成了负面的影响, 甚至造成社会恐慌和危机[1] 。因此还会形成不同类型的伪舆情。因此本文在特征分析的如何尽早识别伪舆情, 科学监督控制网络舆论健康发基础上, 对伪舆情进行分类, 并提出一种基于组合优展是舆情管理面临的严峻问题。化决策树算法的伪舆情识别方法。 2 相关研究 3 伪舆情的特征和分类研究 [2] [3] 3.1 伪舆情的特征伪舆情的概念最早由宋常青提出, 刘勘等、方付建[4]进一步扩展了对网络伪舆情的认知, 并对伪舆 (1) 虚假性情的成因、特征和影响进行了深入分析。综合以上观伪舆情主要表现在引起网络舆论的话题事件、网点, 本文认为伪舆情是指在诸如网络推手炒作或虚假络言论等的不真实的、夸大的、歪曲的成分。如果引信息刺激等手段的推动下, 使民众产生的带有倾向性起某种网络舆情的发帖存在真实性的问题, 那么这个的多种评论、情绪、态度、意见的总和。目前针对在舆情的展开实际上是个伪命题, 也就必然成为伪舆线虚假评论识别的研究已充分开展, 如孟美任等[5]采情。具体表现在数据造假、捏造事实、隐瞒真相、夸用CRFs 模型对在线中文商品评论进行可信度分类。大事实等。通讯作者: 赵静娴, ORCID: 0000-0003-1014-4676, E-mail: nzjx2012@163.com 。 78 现代图书情报技术总第259 期 2015 年第6 期 (2) 人为性

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于决策树的网络伪舆情识别研究.PDF