基于Single-Pass的微博热点话题检测.doc

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE30

PAGE30

基于Single-Pass的微博热点话题检测

摘要

近年来,社交网络蓬勃发展,微博在众多社交网络中脱颖而出。如何从海量微博信息中检测热点话题成为一个具有现实意义的研究课题。基于此,提出基于Singe-Pass聚类算法的微博热点话题检测,在检测过程中选取基于微博意见领袖信息获取的方法,可有效解决如何降低数据采集的规模、低价值信息过滤的问题从而提高话题检测的速度和准确性。其次对采集的数据进行预处理从而优化微博文本的特征选择。最后分析了不同四种聚类算法的优缺点,选取适合微博短文本的Single-Pass聚类算法。针对经典的Single-Pass算法

文档评论(0)

瀚海文化 + 关注
实名认证
内容提供者

创造文章的海洋,感受知识的魅力

1亿VIP精品文档

相关文档