基于层次评分函数的多粒度搜索算法研究.pdfVIP

  • 5
  • 0
  • 约1.28万字
  • 约 4页
  • 2017-04-01 发布于北京
  • 举报

基于层次评分函数的多粒度搜索算法研究.pdf

基于层次评分函数的多粒度搜索算法研究.pdf

收稿日期:2014-09-17;修回日期:2014-1 1-07 基金项目:湖北省国际交流与合作项目(2012IHA0140);湖北省教育厅科学技术研究计 划指导性项目(B2014153) 作者简介:姜攀(1981-),男,湖北武汉人,讲师,硕士研究生,主要研究方向为软件工程、算法设计等(jiangpandaxue@163.com);李跃新(1958-), 男,湖北武汉人,教授,博士,主要研究方向为人工智能与知识工程、智能控制系统、嵌入式技术. 基于层次评分函数的多粒度搜索算法研究* 姜 攀1,2,李跃新3 (1.武汉理工大学 计算机科学与技术学院,武汉 430070;2.武汉商学院 信息工程系,武汉 430056;3.湖北大学 计算机与信息工程学院,武汉 430064) 摘 要:在线论坛中包含了大量的有用信息,通过检索论坛中的数据用户可以方便地获取所需的知识,然而论 坛数据的层次特征给内容检索提出了严峻的挑战。针对论坛数据的层次特征,提出了一种基于层次评分函数的 多粒度搜索方法。将论坛数据用树型层次结构表示,并基于多个因素提出了融合话题、发言、语句和单词多个粒 度的层次评分函数。为了避免多种粒度的数据在返回结果中具有重复性,提出了一种有约束的返回结果最大化 模型。将返回结果最大化模型转换为最大独立集合问题,并给出了一种启发式优化算法。实验表明,提出的算 法在检索论坛数据时不仅具有很好的效率,而且准确性非常高。 关键词:论坛;信息检索;层次评分函数;多粒度搜索 中图分类号:TP391;TP301.6 文献标志码:A 文章编号:1001 3695(2016)01 0101 03 doi:10.3969/j.issn.1001 3695.2016.01.023 Hierarchical scoring function based multi granularity searching method Jiang Pan1,2,Li Yuexin3 (1.School ofComputer Science &Technology,Wuhan University ofTechnology,Wuhan 430070,China;2.Dept.ofInformation Engineering, Wuhan Business University,Wuhan 430056,China;3.School ofComputer Science & Information Engineering,Hubei University,Wuhan 430064,China) Abstract:Online forums contains much useful information,which makes it convenient for users to retrieve necessary know ledge,however,the hierarchical structure of forum data poses great challenges to content retrieve.In order to solve this prob lem,this paper proposed a hierarchical scoring function based multi granularity searching method.Firstly,it represented the forum data with trees,and gave a scoring function including topics,posts,sentences and words based on several considera tions.Secondly,in order to avoid the replication of data in results of multi granularity,it proposed a maximization model of re sults with constraints.Finally,it transformed the maximization model of results into the problem of maximal independent sets, and gave a heuristic optimal algorithm.The experiments show that,the proposed method is more efficient and accurate that re lated works while retrieving f

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档