web 评论主流观点提取及不同源数据的对比分析 - 北京大学.pdf

web 评论主流观点提取及不同源数据的对比分析 - 北京大学.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
web 评论主流观点提取及不同源数据的对比分析 - 北京大学

第 46 卷 增刊 计 算 机 研 究 与 发 展 Vol.46, Suppl. 2009 年 10 月 JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT Oct. 2009 Web 评论主流观点提取及不同源数据的对比分析 孔亮 石磊 孙柏 张岩* 北京大学智能科学系,北京 100871 klangelfox@ Web Comment Analyzing and Opinion Comparison among Different Sources Kong Liang, Shi Lei, Sun Bai , and Zhang Yan* (Department of Machine Intelligence Peking University, Beijing 100871) Abstract With the popularization of the Internet and public media, the network media gradually becomes the most used network application. The interaction of media and the rich content of the Web lead to the explosion of Web comments. This makes the automatic mining of the mainstream opinions on the Web and the characteristics of different data sources particularly significant. The paper has two contributions: Firstly, it puts forward the method on automatic mining of Web mainstream opinions. Our method can automatically dig out the main trend opinions under a certain subject, with two critical processes named “comment classification” and “opinion description”. It even further uses several keywords and one representative remark to describe each mainstream opinion. Secondly, with this method, this paper analyzes and compares the opinion data from different sources. Keywords web comment; mainstream opinion extraction; opinion analysis 摘要 随着互联网普及率的不断提高和大众媒介的网络化,网络媒体逐渐成为使用率最高的网络应用。媒介的互动性和网络的 海量性导致了网络评论的大量出现,使得网络评论主流观点的自动提取以及不同源数据的对比分析格外具有意义。本文针对以 上问题展开研究,主要有两点贡献:第一,提出了一种自动提取网络评论主流观点的方法,该方法克服网络评论的复杂性和海 量性,通过“Web 评论观点鉴别”和“主流观点描述”两个核心部分的处理,自动提取出某一主题下评论的主流观点,并针对 每个主流观点,使用关键词和代表性评论对其进行描述;第二,利用该方法对来自不同数据源的网络评论进行对比分析,给出 了不同数据源的网络评论特点及差异。 关键词 Web 评论;主流观点提取;评论分析 中图法分类号 TP391 民使用最多的网络应用。媒介的互动性和网络的海量 1. 引言 性,创造了吸引受众


wujianz + 关注


