- 7
- 0
- 约4.45千字
- 约 8页
- 2016-11-23 发布于北京
- 举报
面向问句检索的词项赋权研究.doc
面向问句检索的词项赋权研究
摘要:在社区型问答服务中,存在大量的由用户生成的问题及答案,一方面用户可以通过发布新问题,等待其他用户的回答;另一方面用户可以通过搜索与当前问题相关或者相似的问题,从而得到相应的答案。随着社区型问答服务的发展,用户更加关注问题检索服务的质量,因此如何合理并有效地检索出与用户当前问题相关或相似的问题,成为社区型问答服务的核心任务。对社区型问答服务中用户问题的特点进行了分析,提出一种确定问题中词项重要性的方法,从而改进传统问题检索模型中计算当前问题和候选问题集之间相关度的方法,提高问题检索质量。实验证明文中的方法在MAP、MRR及R-precision三项指标中均有提高。同时,分析了影响词项重要度的实验特征,得出最优的特征集合。
关键词:社区型问答; 问题检索; 词项赋权
中图分类号:TP391 文献标识码:A 文章编号:2095-2163(2013)05-0054-04
0引言
传统的检索模型如布尔模型、向量空间模型、Okapi BM25模型及语言模型等,能够有效衡量用户查询与候选文档之间的关系。在社区型问题检索中,由于用户问题形式的复杂性及候选文档长度的特殊性,使得传统的检索模型在问题检索任务中的有效性和适用性受到限制,与其相对应的词项赋权机制的合理性也有待验证。此外,Xue et al [1]提出的利用翻译模型自动获取问题词
原创力文档

文档评论(0)