针对问答系统隐性垃圾内容的答案再排序模型.pdfVIP

针对问答系统隐性垃圾内容的答案再排序模型.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
针对问答系统隐性垃圾内容的答案再排序模型

优先出版 计 算 机 应 用 研 究 第33 卷 针对问答系统隐性垃圾内容的答案再排序模型* 田 雅,郑明春,乔 鸿 (山东师范大学 管理科学与工程学院,济南 250014) 摘 要:社会化问答系统为人们提供知识共享的平台,然而网站上存在着诸如推广信息的隐性垃圾内容,这些内容在包 含诸多有用的内容的基础上含有虚假的推广信息,这些虚假信息可能会带来更严重的后果,因此,如何检测及识别这些 隐性的垃圾内容尤为重要。通过在任务型的网上交易平台上搜集实验数据,创新地提出了一种基于物理学牛顿第二运动 定律的优化的答案排序模型,旨在原有的答案序列的基础上,加入隐性垃圾内容的特征,通过将回答者提交的答案看成 是受多个“力”作用的物体,答案的排序看成是物体的下落过程,来对答案进行重新排序,使虚假信息沉淀到答案序列 下方。实验证明,此模型能够快速有效地完成对答案的排序,实现按照质量对答案进行排序。 关键词:问答系统;隐性垃圾内容;答案再排序 中图分类号:TP391 Re-ranking model for implicit spam answers in CQA Tian Ya, Zheng Mingchun, Qiao Hong (School of Management Science Engineering, Shandong Normal University, Jinan 250014, China) Abstract: Community question answering system provide a platform for people to share knowledge. However, there are some content like the promotion of information hidden in the answers. It may lead to serious consequences. Therefore, how to detect and identify this hidden spam is particularly important. By collecting experimental data on a task-based online trading platform proposes an optimization model for re-ranking answers using physics of Newtons second law innovatively. Each answer is seen as a falling object with several forces. And, the answers will be rearranged, letting the spam information to the bottom of the answer sequence. Experiments show that this model can be completed quickly and efficiently in re-ranking the answer sequence. Key Words: CQA; Implicit spam answers; Re-ranking model 也可以是回答者。现如今,数以亿记的用户使用社会化问答网 0 引言 站来寻求帮助。如今国内较流行的问答网站有百度知道、新浪 在Web 2.0 时代,用户既是网络信息资源的消费者,同时 爱问知识人、腾讯搜搜问问、知乎等。 也是网络信息资源的制造者。Web2.0 给每位用户提供展现自

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档