一种基于微博平台的事件舆情信息提取方法及系统.pdfVIP

一种基于微博平台的事件舆情信息提取方法及系统.pdf

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(10)申请公布号CN104615627A

(43)申请公布日2015.05.13

(21)申请号CN201410490602.X

(22)申请日2014.09.23

(71)申请人中国科学院计算技术研究所;新华通讯社

地址100190北京市海淀区中关村科学院南路6号

(72)发明人曹娟储达峰金志威张勇东谢菲苏宇

(74)专利代理机构北京律诚同业知识产权代理有限公司

代理人祁建国

(51)Int.CI

G06F17/30

权利要求说明书说明书幅图

(54)发明名称

一种基于微博平台的事件舆情信息

提取方法及系统

(57)摘要

本发明涉及舆情事件提取技术,本

发明公开了一种基于微博平台的事件舆情

信息提取方法及系统,该方法包括:获取

所述事件的关键词、起始时间、截止时

间,并根据所述微博平台搜索服务的链接

格式,构造待采样页面的页面链接;根据

所述页面链接进行微博采样,生成样本微

博,根据所述样本微博,计算所述事件的

事件热度,并根据所述事件热度计算微博

抓取周期;根据所述微博抓取周期,结合

所述页面链接,获取与所述事件相关的微

博页面。提取所述微博页面的微博信息,

以完成提取所述事件的所述舆情信息。本

发明获取事件舆情信息更全面而高效,能

采集到实时的舆情信息。

法律状态

法律状态公告日法律状态信息法律状态

权利要求说明书

1.一种基于微博平台的事件舆情信息提取方法,其特征在于,包括:

步骤1,获取所述事件的关键词、起始时间、截止时间,并根据所述微博

平台搜索服务的链接格式,构造待采样页面的页面链接;

步骤2,根据所述页面链接进行微博采样,生成样本微博,根据所述样本

微博,计算所述事件的事件热度,并根据所述事件热度计算微博抓取周期;

步骤3,根据所述微博抓取周期,结合所述页面链接,获取与所述事件相

关的微博页面;

步骤4,提取所述微博页面的微博信息,以完成提取所述事件的所述舆情

信息。

2.如权利要求1所述的基于微博平台的事件舆情信息提取方法,其特征在

于,所述步骤2还包括:

根据所述关键词,过滤与所述事件无关的微博,并将所述样本微博按发布

时间进行排序。

3.如权利要求1或2所述的基于微博平台的事件舆情信息提取方法,其特

征在于,所述步骤2通过以下公式计算所述事件热度:

mathsmathmrowmsubmiH/mimiE/mi/msubmo=/momfra

cmsubmiC/mimiweibo/mi/msubmrowmsubmiT/mimilast

/mi/msubmo-

/momsubmiT/mimifirst/mi/msub/mrow/mfrac/mrow/math

/maths

其中Csubweibo/sub为所述样本微博的微博数,Tsublast/sub为所述样本微

博中按发布时间排序后最后一条微博的发布时间,Tsubfirst/sub

为所述样本微博中按发布时间排序后第一条微博的发布时间,

HsubE/sub为所述事件热度。

4.如权利要求1所述的基于微博平台的事件舆情信息提取方法,其特征在

于,所述步骤2通过以下公式计算所述微博抓取周期:

mathsmathmrowmit/mimo=/momfencedmtablemtrmtdm

n0/mnmo,/momsubmiH/mimiE/mi/msubmo=/momn0

/mn/mtd/mtrmtrmtdmo[/momfracmiN/mimsubmiH/mi

miE/mi/msub/mfracmo]/momo,/momsubmiH/mim

文档评论(0)

153****9248 + 关注
实名认证
文档贡献者

专注于中小学教案的个性定制:修改,审批等。本人已有6年教写相关工作经验,具有基本的教案定制,修改,审批等能力。可承接教案,读后感,检讨书,工作计划书等多方面的工作。欢迎大家咨询^

1亿VIP精品文档

相关文档