基于主题的舆情跟踪方法研究及性能评价.PDF

基于主题的舆情跟踪方法研究及性能评价.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于主题的舆情跟踪方法研究及性能评价

<<情报研究    基于主题的舆情跟踪方法研究及性能评价 1 2 姚长青  杜永萍 1 2 中国科学技术信息研究所 北京 100038  北京工业大学计算机学院 北京 100124 〔摘要〕舆情跟踪是对媒体信息流中的热点话题进行实时追踪,是近年来自然语言处理领域的研究热点。实现该 任务的核心技术是进行文本分类,运用信息增益以及互信息计算特征项权重,提取向量空间模型中文档表示的有 效特征;分别采用Rocchio、KNearestNeighbor(KNN)、Bayes方法对于给定主题的事件实现舆情跟踪。在测试集上 的最优性能FMeasure值达到86.2%。舆情跟踪在信息安全等领域具有广阔的应用前景,为用户及时判断网络热 点事件的发展趋势提供有效指导依据。 〔关键词〕舆情跟踪 文本分类 自然语言处理 〔分类号〕G350 ResearchandPerformanceEvaluationontheThemeBasedMethodforthePublicOpinionTracking 1 2 YaoChangqing DuYongping 1InstituteofScientificandTechnicalInformationofChina,Beijing100038 2InstituteofComputerScience,BeijingUniversityofTechnology,Beijing100124 〔Abstract〕Theaimofthepublicopiniontrackingistomaketracksfortheprogressoftheappointedhottopicintheinformationflow ofthemedia,andthishasbecomesthehotspotresearchdirectioninthefieldofnaturallanguageprocessinginrecentyears.Thekey techniquetoachievethetaskistextclassification.Theauthorsadoptdifferentmethodsofinformationgainandmutualinformationfor thefeatureselectionwithinthevectorspacemodel.Theyareusedfortheweightcalculationandtheeffectivefeatureswithhigherweight valuesareextracted.TheapproachofRocchio,KNNandBayesareadoptedtoimplementthepublicopiniontrackingonagiventopic events.Finally,theauthorsgivethestatisticaldataanalysisandachievetheperformanceof86.2%FMeasureonthetestset.Public opiniontrackinghasabroadapplicationprospectintheareasofinformationsecurityandsoon.Itprovidestheeffectiveguidancefor thedeterminationtothedevelopmenttrendofthenetworkhotevents. 〔Keywords〕publicopiniontracking textclassification naturallanguageprocessing 处

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档