基于特征情感色彩的文档流派分类研究.pdfVIP

基于特征情感色彩的文档流派分类研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于特征情感色彩的文档流派分类研究.pdf

基于特征情感色彩的文档流派分类研究 熊云波李荣陆胡运发 复旦大学计算机与信息技术系200433 63.com. e_mail:.WINBOWL@1 摘要:流派分类在信息检索、信息过滤、反动信息的拦截和网上舆情调查等方面发挥了越来越重要的 作用。本文介绍一种根据特征词的情感色彩来实现文档流派自动分类的方法,并实现了一个信息内容安全 原型系统。 关键词:流派、情感特征、文档流派分类 rextGenreClassificationonSentimentof Based Features XiongYun—bo,Lirong-lu,Huyun—fa of Informationand (DepartmentComputing Technology,FudanUniversity,Shanghai,China200433) 63.eom. e-mail:,WINBOWL@1 Abstract:Textclassificationhasbecomemoreandmore ininformationretrieval, genre important information ofreactive and information frominternet.In filtering,counterchecking investigationofpublicfeelings this an isthusmadeto text classificationtothesentimentoffeatures. paperattempt implementgenre according Anda ofinformationcontent hasbeen prototype securitysystem developed. GenreClassification KeyWords:Genre,SentimentofFeatures,Text 1.引言 文档流派描述的是文档的风格,而不是文档的内容。一个流派类就是一些语言和文字风 格相似的文档集。文档的流派和文档的主题是正交的,相同主题的文档可以有不同的流派, 相同流派的文档可以描述的是不同的主题。 流派是一个非常抽象和模糊的概念,不同流派类别之间没有明显的界限,流派的划分也 具有非常大的主观性。因此,文档流派类别的划分往往和应用相关,从不同的角度出发,可 以将文档分为不同的流派类别:客观性和主观性、正面和反面、健康信息和不良信患等。文 献[1]和文献[2]对文档的客观性和主观性分类进行了研究。正面和反面是对主观性文档的 一种分类,如果文档中表达一种赞许的态度,则文档是正面的;如果表达的是一种批评、反 对的态度,则文档是反面的。文献[3]、[4]、[5]、[6]、[7]对文档的观点是正面还是反面 进行了讨论。不良信息是指那些反动、色情或用户反感的信息。文献[8]、[9]使用语义模式 作为文档的特征,识别文档描述的是否为法轮功反动信息。 如今,面对互联网上海量的复杂的各类文本信息,根据文档的风格(啦le)或流派(genre) 查找一些和我们应用相关的信息,过滤一些不相关的信息,或者拦截那些网络上反动、色情 和令人反感的信息,已经成为个人、企业和政府有关部门的必需。如果能够对文档流派信息 进行自动分析,我们就可以获得更多文档的附属信息,这对信息检索、信息过滤、反动信息 的拦截和网上舆情调查等方面都非常有用。 本文主要考虑“正面的和反面的”或者“健康

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档