- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第35卷第12期 计 算 机 应 用 研 究 Vol35No12
2018年12月 ApplicationResearchofComputers Dec.2018
具有词判别力学习能力的
短文本聚类概率模型研究
牛亚男a,b
(北京交通大学a.计算机与信息技术学院;b.交通数据分析与挖掘北京市重点实验室,北京 100044)
摘 要:社交媒体的广泛使用使短文本聚类成为一个重要的研究课题。为了解决由于短文本词向量的高维、稀
疏性而造成的传统文本聚类方法应用在在短文本上效果欠佳的问题,通过大量的研究调查发现由于短文本词向
量的稀疏性,词对簇结构的判别能力对短文本类结构的学习尤为重要。在经典文本聚类模型 LDA(latent
Dirichletallocation)、BTM(bitermtopicmodel)和GSDMM(Gibbssamplingdirichletmultinomialmixturemodel)中增
加二项分布来衡量词对类结构学习中的判别力强弱,并通过Gibbs采样算法对模型中的参数进行求解。最后在
真实数据集上的实验结果显示,增加词判别力的学习可以提高现有概率模型聚类方法的精确度、互信息值和F
值,验证了词判别力学习对类结构学习的有效性。
关键词:短文本聚类;概率模型;判别力
中图分类号:TP391.1 文献标志码:A 文章编号:10013695(2018)12356906
doi:10.3969/j.issn.10013695.2018.12.011
Researchonshorttextclusteringprobabilitymodelwithworddiscriminationability
a,b
NiuYanan
(a.SchoolofComputer&InformationTechnology,b.BeijingKeyLaboratoryofTrafficDataAnalysis&Mining,BeijingJiaotongUniversity,
Beijing100044,China)
Abstract:Thewidespreaduseofsocialmediamakesshorttextsclusteringanimportantresearchtopic.Inordertosolvethe
problemthatthetraditionaltextclusteringmethoddonotwellinshorttextcausedbythehighdimensionandsparsenessofthe
shorttextwordvector.Itfindthatduetothesparsenessoftheshorttext,theworddiscriminativeabilityisparticularlyimportant
forthestudyofshorttextclassstructures.IntheclassicaltextclusteringmodelLDA(latentDirichletallocation),BTM(biterm
topicmodel)andGSDMM(Gibbssamplingdirichletmultinomialmixturemodel),itaddedthebinomialdistributiontomeasure
thediscriminantabilityintheclassstructurelearning,andsolvedtheparametersinthemodelbyGibbssamplingalgorithm.Fi
na
您可能关注的文档
- 人类与地理环境的协调发展人地关系思想的历史演变2.PPT
- 人车协同感知系统研究-软件工程杂志社.PDF
- 仁和大道供水管道工程Ⅲ标g3井三五道砼支撑及腰梁-中铁七局.DOC
- 人防工程定额人工费材料费调整系数.DOC
- 人际关系的魅力.PPT
- 从1982年初在河南大学工作算起我从事地理学教学与研究已有34个.PDF
- 从一个新视角看休谟哲学的认识论-四川师范大学学报.PDF
- 从人生论视角看郭象玄学体系-武汉大学学报.PDF
- 从GWAS到EWAS姜永帅Email.PPT
- 从关联理论看语用翻译-JournalofNortheasternUniversity-东北大学.PDF
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)