改进支持向量机在微博热点话题预测中应用.docVIP

改进支持向量机在微博热点话题预测中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改进支持向量机在微博热点话题预测中应用

改进支持向量机在微博热点话题预测中应用   〔摘要〕为了提高微博舆情的预测精度,针对不同单一核函数的局限,用线性拟合确定两种核函数的权重提出改进的支持向量机模型。首先利用马尔科夫模型矩阵的稀疏程度提取影响因子指标,得到微博传播的增减趋势;然后用改进的支持向量机对实时数据按照4∶1的比例划分测试集和训练集,进行实时预测与警示。实验结果表明:应用马尔科夫模型进行微博舆情的主成分提取效果较佳,改进的支持向量机构造了新的组合核函数,比传统的预判效果更佳。   〔关键词〕马尔科夫模型;组合支持向量机;微博;舆情;热点话题;预测   DOI:10.3969/j.issn.1008-0821.2017.03.009   〔中图分类号〕G206〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0046-06   〔Abstract〕In order to improve the prediction accuracy of Microblog public opinion and make up for performance deficiency of single kernel function,the weight coefficients of two kernel functions have been calculated by linear fitting.The Markov matrix was used to determine the weights of the impact factors and the trend of Microblog public opinion.Improved support vector machine was used to divide real time data into training set and test set according to the proportion of 4∶1.Experiment showed that the features which affected micro blogging publica opinion,had been mined better by using Markov model;Optimized SVM model constructed a new combined kernel function,and the forecasting results were better.   〔Key words〕Markov model;combination support vector machine;microblog;public opinion;hot topic;prediction   目前我国针对舆情分析指标的研究有很多,按照功能的完善程度分为告警和预警。告警模型如李纲等在突发公共事件大背景下,对突发公共事件、公共卫生事件、社会安全事件等指标进行分析,结合信息空间模型分析微博舆情传播的过程,构建微博舆情监测指标[1]。易臣何分析微博舆情的传播特点,在此基础上研究演化规律[2]。预警模型如朱卫红等采用离散的时间序列和地图定位做生态画像,根据标签特征进行提取、分析并提前一定的时间周期告警实现预警目标[3]。叶金印等建立了多条预判拟合函数进行分类和预测,用MAE等误差指标寻优[4]。   针对微博舆情预测算法的研究,不同算法有不同的业务场景的优点,例如局部最优、全局最优等的差别。例如杜智涛等用灰色预测方法,用微分方程解法做时间序列回归模型[5]。张华基于BP-神经网络算法对其经典模型进行优化,对输入层与隐含层的矩阵、隐含层与输出层的矩阵权值的稀疏性处理较好[6]。魏德志提出用混沌理论解决非线性的函数,一改用线性函数进行拟合的前提假设,并且改进了径向基核函数,使得神经网络发挥了在具体舆情预测中的优点以提高数据准确性[7]。   微博话题的影响因子与权值矩阵的处理是预测准确度提升的保证。虽然微博话题的影响因子有很多,但是许多学者的研究主要在于确定影响因子之间内在逻辑,往往难以分离各个指标确定各自的权重而进行定量分析。也有一些学者涉及定量的研究,但是用户能获取到的微博指标权限有限,实际操作无法进行。因此,本文基于容易获取到的一些指标,进行两个算法过程的预测与验证,分别从不同角度预测趋势,得到较好的预测效果,供舆情部门参考。   1马尔科夫模型的增减趋势预判   马尔科夫区别于回归模型,在于将问题看作是离散随机过程,并非连续函数,且强调下一个时间节点的状态与上一个无关(即相邻两个时间节点的数据无法互相影响)[8]。而这恰恰更适合预测随机波动大的动态过程,可弥补灰色预测的局限[9]。

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档