- 33
- 0
- 约2.31万字
- 约 7页
- 2018-01-14 发布于天津
- 举报
基于SVM的文本情感极性分类研究
第31卷 第3期 广东工业大学学报 Vol.31No.3
2014年9月 JournalofGuangdongUniversityofTechnology September2014
doi:10.3969/j.issn.10077162.2014.03.017
基于SVM的文本情感极性分类研究
陈培文,傅秀芬
(广东工业大学 计算机学院,广东 广州510006)
摘要:文本情感极性分类是文本情感分析首先要解决的关键问题.在分析影响文本情感分类的各类因素的基础上,
首先构建了情感词典,并进行情感特征选取以及情感特征加权,然后使用SVM分类的方法对文本进行情感识别及
分类,最后在语料数据集的基础上,在单机平台上和Spark分布式计算平台上执行分类模型,对比分析其分类精度
和时间代价.实验结果验证了本文构建的情感极性分类模型在单机和分布式云平台上中的有效性.
关键词:情感分类;支持向量机;Spark分布式计算平台
中图分类号:TP309 文献标志码:A 文章编号:10077162(2014)03009507
ResearchonSentimentClassificationofTextsBasedonSVM
ChenPeiwen,FuXiufen
(SchoolofComputers,GuangdongUniversityofTechnology,Guangzhou510006,China)
Abstract:Thekeyproblemtosolveinasentimentanalysisoftextsisthesentimentpolarityclassifica
tion.Basedontheanalysisofvariousfactorsaffectingsentimentclassificationoftexts,itbuiltthesenti
mentlexicon,extractedaffectivecharacteristics,andweightedsentimentalfeatures.Then,itusedsup
portvectormachine(SVM)classifierforemotionrecognitionandtextclassification.Finally,itperformed
theclassificationmodelwiththecorpusdatasetsonthesingleplatformandtheSparkdistributedcompu
tingplatformtoanalyzeitsclassificationaccuracyandtimecost.Theexperimentalresultsverifytheeffec
tivenessofthetextsentimentalpolaritycategorizationmodelonthesingleplatformandonthesparkdis
tributedcomputingplatform.
Keywords:sentimentclassification;supportvectormachine;Sparkdistributedcomputingplatform
文本情感分析,又称为倾向性分析、意见挖掘、 研究,并取得一定的成果,大致分为两个方向.
情感分类等.简言之,是对带有情感色彩的主观性文 1)使用情感词典及规则.
[1] [2]
本进行分析、处理、归纳和推理的过程 .开放性极 Turney等 针对情感词的不足,使用PMI方法
强的互联网使得
您可能关注的文档
- 固定资产更新的决策分析-财务管理.PPT
- 固态液态和气态的基本特征.PPT
- 固溶处理对304L不锈钢晶粒长大及力学性能的影响.PDF
- 固溶处理对挤压铸造All5Si4Cu05Mg01Mn合金显微组织及硬.PDF
- 固溶温度对Ti2AlNb基合金组织演变的影响-IngentaConnect.PDF
- 固载化AICI3催化剂在苯与长链烯烃烷基化反应中-中国科技论文在线.PDF
- 国产P91钢新型焊条的研发及其性能试验研究.PDF
- 国产核I级ER308L焊丝性能研究-江苏科技大学学报.PDF
- 国产塑料一金属三层复合自润滑材料的性能及其应用.PDF
- 国产桥梁斜拉索用1770MPa镀锌钢丝制造技术的研究-中国工程科学.PDF
原创力文档

文档评论(0)