基于滚动LDA模型的文本主题变点估计研究.pdf

基于滚动LDA模型的文本主题变点估计研究.pdf

基于滚动LDA模型的文本主题变点估计研究

中文摘要

文本数据有着复杂性和非标准性的特点,难以直接使用传统的数据处理方

法进行分析,同时文本主题可能随着时间的变化而发生变化,研究文本主题变

化有助于人们理解文本信息的演化趋势及其背后的社会、经济、文化等因素。

鉴于滚动狄利克雷分配(LDA)模型能够把文本数据转换成便于分析的数值型

数据,本文基于滚动LDA模型并结合最窄超阈值(NOT)方法和种子二值分割

(SeedBS)方法研究文本主题变点估计问题。主要内容如下:

(

文档评论(0)

1亿VIP精品文档

相关文档