短文本流突发性话题发现:BBTM改进算法.docVIP

  • 11
  • 0
  • 约3.54千字
  • 约 5页
  • 2017-10-25 发布于北京
  • 举报

短文本流突发性话题发现:BBTM改进算法.doc

短文本流突发性话题发现:BBTM改进算法   摘要:BBTM模型克服了数据稀疏性和冗余性,是短文本流突发性话题发现的有效方法。然而,BBTM模型量化词对突发概率方法比较简陋且存在不合理性,对周期性话题关联词对的突发概率估计有偏差,故提出了一种结合基于自动状态机的枚举突发词对和正态分布的改进方法。实验证明,该方法能够为模型建模提供更准确的先验知识,从而提高模型对突发话题的敏感度和话题抽取的准确度。   关键词: 短文本; 突发性; BBTM; 枚举突发; 正态分布   中图分类号:TP181 文献标识码:A 文章编号:1009-3044(2017)01-0248-03   Abstract:BBTM is an effective model for bursty topic discovery in short texts well solve data sparsity and redundancy. However, the method used to quantify the burstiness of biterms proposed by BBTM is pool and irrational, making the wrong kind of assumptions about biterm bursty probability related to peri

文档评论(0)

1亿VIP精品文档

相关文档