- 22
- 0
- 约2.5万字
- 约 7页
- 2018-01-28 发布于天津
- 举报
优先出版计算机应用研究第卷模型下不同分词方法对文本分类性能的影响研究李湘东高凡丁丛武汉大学信息管理学院信息资源研究中心武汉摘要通过定义类别聚类密度类别复杂度以及类别清晰度三个指标从语料库信息度量的角度研究多种代表性的中文分词方法在隐含概率主题模型下对文本分类性能的影响定量定性地分析不同分词方法在网页和学术文献等不同类型文本的语料上进行分类的适用性及影响分类性能的原因结果表明三项指标可以有效指明分词方法对语料在分类时产生的影响分词法和分词法分别受类别复杂度和类别聚类密度的影响较大二元分词法受三个指
优先出版 计 算 机 应 用 研 究 第34 卷
LDA 模型下不同分词方法对文本分类性能的影响研究*
a, b a b
李湘东 ,高 凡 ,丁 丛
原创力文档

文档评论(0)