- 29
- 1
- 约3.16万字
- 约 8页
- 2017-10-01 发布于天津
- 举报
基于迁移学习的唐诗宋词情感分析.PDF
第11期 电 子 学 报 Vol.44 No.11
2016年11月 ACTAELECTRONICASINICA Nov. 2016
基于迁移学习的唐诗宋词情感分析
吴 斌,吉 佳,孟 琳,石 川,赵惠东,李仪清
(北京邮电大学智能通信软件与多媒体北京市重点实验室,北京 100876)
摘 要: 随着计算社会学的兴起,利用数据挖掘分析社会情感是近期的研究重点.当前的研究主要针对现代文
本,对于古代诗歌这类短文本的情感分析相对较少.本文提出了一个基于短文本特征扩展的迁移学习模型 CATL
PCO,通过分析诗歌情感对当时社会及文化进行进一步了解.该模型首先基于频繁词对对古文特征向量进行扩展,再
通过迁移学习方式,建立三个分类器并投票得出最后的情感分析结果.CATLPCO模型首先能够解决古文短文本特征
稀疏的问题,在此基础上进一步解决由于现代译文信息匮乏所导致的古代诗歌情感分析困难问题,从而准确的分析古
诗词情感倾向,从计算社会学的角度,增进对中国历史的认识.实验表明,当训练集为中国唐诗时,本文提出方法能够
准确的对唐代诗歌进行情感分类,并能应用于唐代和宋代各个时期情感分析及代表流派分析.
关键词: 情感分析;社会计算学;唐诗宋词;迁移学习
中图分类号: TP393 文献标识码: A 文章编号: 03722112(2016)11278008
电子学报URL:http://www.ejournal.org.cn DOI:10.3969/j.issn.03722112.2016.11.030
TransferLearningBasedSentimentAnalysisforPoetryofthe
TangDynastyandSongDynasty
WUBin,JIJia,MENGLin,SHIChuan,ZHAOHuidong,LIYiqing
(BeijingKeyLaboratoryofIntelligentTelecommunicationsSoftwareandMultimedia,
BeijingUniversityofPostsandTelecommunications,Beijing100876,China)
Abstract: Withtheriseofcomputationalsocialscience,analyzingsocialsentimentwithdataminingmethodshasat
tractedwidespreadattentionandhasbecomeahotspotinrecentyears.Existingresearchesofsentimentanalysismainlyfocus
onmoderntext,buthardlyinvolvetheancientshorttextliterature.Thispaperproposesashorttextfeatureextensionbased
transferlearningmodelCATLPCO(CorrelationAnalysisTransferLearningProbabilityCooccurrence).Throughsentiments
analysisinancientliterature,thispapercandiscoverysocialandculturaldevelopmentintheancientera.CATLPCOexpands
theancientliteraturefeaturevectorbasedonthefrequentwordpairs,andutilizestransferlearningmethodtotrainthreesenti
原创力文档

文档评论(0)