基于SVM的文本情感极性分类研究.PDFVIP

  • 33
  • 0
  • 约2.31万字
  • 约 7页
  • 2018-01-14 发布于天津
  • 举报
基于SVM的文本情感极性分类研究

第31卷 第3期 广东工业大学学报   Vol.31No.3                  2014年9月  JournalofGuangdongUniversityofTechnology   September2014 doi:10.3969/j.issn.10077162.2014.03.017 基于SVM的文本情感极性分类研究 陈培文,傅秀芬 (广东工业大学 计算机学院,广东 广州510006) 摘要:文本情感极性分类是文本情感分析首先要解决的关键问题.在分析影响文本情感分类的各类因素的基础上, 首先构建了情感词典,并进行情感特征选取以及情感特征加权,然后使用SVM分类的方法对文本进行情感识别及 分类,最后在语料数据集的基础上,在单机平台上和Spark分布式计算平台上执行分类模型,对比分析其分类精度 和时间代价.实验结果验证了本文构建的情感极性分类模型在单机和分布式云平台上中的有效性. 关键词:情感分类;支持向量机;Spark分布式计算平台 中图分类号:TP309      文献标志码:A      文章编号:10077162(2014)03009507 ResearchonSentimentClassificationofTextsBasedonSVM ChenPeiwen,FuXiufen (SchoolofComputers,GuangdongUniversityofTechnology,Guangzhou510006,China) Abstract:Thekeyproblemtosolveinasentimentanalysisoftextsisthesentimentpolarityclassifica tion.Basedontheanalysisofvariousfactorsaffectingsentimentclassificationoftexts,itbuiltthesenti mentlexicon,extractedaffectivecharacteristics,andweightedsentimentalfeatures.Then,itusedsup portvectormachine(SVM)classifierforemotionrecognitionandtextclassification.Finally,itperformed theclassificationmodelwiththecorpusdatasetsonthesingleplatformandtheSparkdistributedcompu tingplatformtoanalyzeitsclassificationaccuracyandtimecost.Theexperimentalresultsverifytheeffec tivenessofthetextsentimentalpolaritycategorizationmodelonthesingleplatformandonthesparkdis tributedcomputingplatform. Keywords:sentimentclassification;supportvectormachine;Sparkdistributedcomputingplatform   文本情感分析,又称为倾向性分析、意见挖掘、 研究,并取得一定的成果,大致分为两个方向. 情感分类等.简言之,是对带有情感色彩的主观性文 1)使用情感词典及规则. [1] [2] 本进行分析、处理、归纳和推理的过程 .开放性极 Turney等 针对情感词的不足,使用PMI方法 强的互联网使得

文档评论(0)

1亿VIP精品文档

相关文档