主题模型发展及应用研究.docVIP

  • 346
  • 0
  • 约6.23千字
  • 约 13页
  • 2018-08-15 发布于福建
  • 举报
主题模型发展及应用研究

主题模型的发展及应用研究   摘要:主题模型是自然语言处理中的重要模型之一。随着科技的发展,主题模型也在不断完善。文章简要介绍了主题模型发展经历的几个阶段,其主要介绍了LDA模型。文章对主题模型确定主题数的方法进行了总结,并通过一个具体实例,来进一步了解LDA模型以及在应用中遇到的问题。这有助于更加深刻理解主题模型,特别是LDA模型。   关键词:主题模型发展;LDA 主题模型;主题数   中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)15-0016-03   1 概述   主题模型是一种概率生成模型,主要包括概率潜在语义索引(pLSI)和潜在狄利克雷分(LDA)。主题模型的应用广泛,涉及很多方面,尤其是在自然语言处理中。   2 主题模型的发展   科技在飞速发展,数据量也越来越大。数据的形式不再仅限于数字形式,文字形式的数据同样是不可忽视的。文本数据隐藏着大量有价值的信息,需要我们去挖掘探索。想要快速了解大量的文本数据讲的是什么,主题模型随之产生。   2.1 向量空间模型   向量空间模型(VSM),它是将文本数据数字化,转化为文本空间中的数字向量。然后通过计算文本空间中向量之间的相似性来判断文档之间的相似性。   2.2 TF-IDF文本模型   TF-IDF文本模型是最早的文本模型之一。它是以信息论中TF-IDF公

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档