- 19
- 0
- 约1.66万字
- 约 5页
- 2017-08-20 发布于安徽
- 举报
NCMMSC’2009 ,8 月 14-16 日,新疆乌鲁木齐
基于LDA分析的词聚类算法*
楚彦凌,刘刚
(北京邮电大学 信息与通信学院,北京 100876)
摘 要:
本文提出一种新的基于 LDA 分析的词聚类算法,生成基于类的语言模型,利用 LDA(Latent Dirichlet Allocation)
分析词在不同主题上的分布,得到词的特征向量,对其进行 k 均值聚类。由于这种聚类方法融入了文本语义信息,
使得聚类的结果因注入了上下文的信息而更加实用化。
关键词:语言模型;LDA(Latent Dirichlet Allocation) ;词聚类;
中图分类号: TP391
近年来,统计语言模型已经应用在越来越 后来,人们提出了利用上下文关系的聚类
多的领域中:信息检索,信息抽取,机器翻译, 方法,来实现基于类的语言模型,例如,基于
语音识别等众多领域[1][2] 。当前最常
您可能关注的文档
- 弘扬民族优秀传统文化塑造城市先进文化品格--结合近年来广州弘扬中华茶文化的实践谈城市先进文化品格的塑造.pdf
- 红菜薹与甘蓝型油菜远缘杂交后代的植物学和细胞学分析.pdf
- 红色印泥双提取溶剂的选择研究.pdf
- 洪广祥补益宗气理论在慢性阻塞性肺疾病的应用.pdf
- 洪兴祖《论语说》钩沉.pdf
- 论股权出资与法律制度.pdf
- 瘊子甲-科学价值之新探.pdf
- 弧焊机器人柔性加工单元系统设计及运动控制.pdf
- 湖北省阳新县富河水系血吸虫病疫情纵向分析.pdf
- 湖南省现行桑蚕品种主要经济性状平均数的置信限分析.pdf
- 第4课 对称的鱼形(教学设计)一年级美术下册(湘美版2024).docx
- 2024-2025学年山东省德州市德城区青岛版一年级下册期中测试数学试卷.docx
- 第二单元 溶液的酸碱性 第2课时(教学设计)高中化学苏教版2019选择性必修1.docx
- Unit 4 Achievements Period 3(教学设计)高中英语沪教版2020必修第二册.docx
- 全册(教学设计)湘艺版音乐三年级上册.docx
- 第二单元 化学反应的方向与限度 第2课时(教学设计) 高中化学苏教版2019选择性必修1.docx
- 2.1 共价键 第1课时(教学设计)高中化学人教版选择性必修2.docx
- 4.6.2神经调节(第1课时)教学设计-人教版2024八年级上册生物.docx
- Unit 4 The senses Cultural focus(教学设计)高中英语沪教版2020选择性必修第一册.docx
- 2020年中考数学真题分项汇编:数据分析专题.pdf
最近下载
- 2025海淀区高中信息技术学业水平合格性考试(样卷).docx VIP
- 国标图集05s502图集阀门井-国家建筑标准设计图集电子版下载 1.docx VIP
- 水单模板饭店.pdf VIP
- 高压智能组合电器(GIS)生产基地建设项目可行性研究报告模板-拿地立项申报.doc VIP
- 起重机械安装(含修理)程序文件2025版.docx
- 历史爱国人物的事迹材料.docx VIP
- 2026年广东广州市初二地理生物会考考试题库(含答案).docx VIP
- 高速公路施工安全保障体系研究.pptx VIP
- 2025年山东省济宁市任城区小升初英语入学测试(无答案).pdf VIP
- 2026年广东广州市地理生物会考真题试卷+解析及答案.docx VIP
原创力文档

文档评论(0)