学术搜索系统中学者论文搜索和相关论文系统研究与实现.pptVIP

学术搜索系统中学者论文搜索和相关论文系统研究与实现.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学术搜索系统中学者论文搜索和相关论文系统研究与实现

学术搜索系统中的学者论文搜索和相关论文推荐系统研究与实现 答 辩 人 : 夏成银 指 导 老 师: 陆嘉恒 教授 专 业: 计算机软件与理论 2014/12/11 目 录 选题背景 相关工作 系统设计和研究方案 特色和创新点 参考文献 选题背景 学术搜索系统 选题背景 学术搜索系统方面,国内外都有已经有一些系统,比如谷歌学术、微软学术搜索、百度学术,它们在提供学术资源检索等功能的基础上,都有各自的特色。 Google Scholar:依托于谷歌自身做搜索引擎的数据资源优势,谷歌学术中可以搜索到世界上几乎所有的学术期刊等学术资源。 Academic Search:在内容方面,Academic Search也致力于提供学术资源对象级别的检索服务。 百度学术搜索:可以检索到免费和收费的学术论文,并能够根据相关性、被引用次数和发表时间等进行排序。 ArnetMiner:对学者的社会网络等信息进行了进一步的挖掘,某个学者的研究方向等更加深入的信息。 选题背景 从上面可以看出,各个学术搜索系统除了提供学术资源检索等基本功能之外,都有自己的侧重点和特色。但是,由于学术搜索面向用户的多样性和国内计算机学科发展的特点,关于学术搜索,仍然有大量的工作需要做。 不同层次的学者对计算机学术搜索系统的需求不一样,比如刚开始做研究的学者想大致了解某个方向,而资深的老师想了解进一步的深入,想了解某个领域最新的趋势。 对于国内的计算机研究人员,中国计算学会对于国际上的论文期刊有不同的A、B和C等三个分级认定,这个分级相当于对某篇学术论文的质量和水平做了一个比较客观的论断。通过该分级,国内的学者能够对某一篇论文有一个大概的直观认识。 学术搜索系统中的学者论文搜索和相关论文推荐系统 计算机领域的论文、学者和单位搜索 计算机领域论文的CCF分级 DBLP论文数据的自动更新 相关论文的推荐 目 录 选题背景 相关工作 系统设计和研究方案 特色和创新点 参考文献 相关工作 1、学术搜索系统 返回所有结果排序后的结果(Google Scholar) 优点:返回的结果比较全 缺点:没有对结果进行整理,需要用户自己从中寻找有用的结果 垂直搜索和对象级别的检索(Microsoft Academic Search) 是对库中的相关信息进行整合,抽取出需要的数据进行处理后再以某种形式返回给用户。 提供面向资源对象级别的更加细化的检索 对学术社交网络中的信息进行进一步的挖掘 Arnetminer 相关工作 2、相关论文推荐 (1) 推荐算法 基于内容的推荐(Content-based recommendation) 分析所有待推荐条目的属性特征进行推荐 比如,一个电影网站中,给一个喜欢西部片的用户推荐属于西部片的电影。 协同过滤(Collaborative filtering recommendation) 根据用户或者待推荐条目之间的相似性来进行推荐 比如,在一个在线书店中,对于两个具有相似看书爱好的用户,将一个用户喜欢的书籍推荐给另一个用户。 相关工作 2、相关论文推荐 (2)论文推荐 问题:给定用户的兴趣信息,找出用户可能感兴趣的其他相关论文。 这里的用户兴趣可能是根据用户的浏览信息或者 是其他信息推断得来的。 常用方法:Citations,协同过滤,probabilistic topic modeling 目 录 选题背景 相关工作 系统设计和研究方案 特色和创新点 参考文献 系统设计和研究方案 相关技术: Boostrap、MongoDB、Python、Flask 1、系统设计 (1) 系统架构图 系统设计和研究方案 增量更新设计 论文分级的确定 (2) 模块设计 系统设计和研究方案 2、相关论文推荐 给定一篇论文(计算机领域),找出和该论文相关的其它论文,供用户参考。 输入: DBLP的论文数据(包含题目、作者、会议、期刊、年份等)、计算机领域的学者信息(姓名、单位等)和其他从网络上爬取到的论文摘要等信息。 输出: 对于计算机领域的每一篇论文,找出和它相关的论文。 (1) 问题的定义 系统设计和研究方案 2、相关论文推荐 1) 论文到论文的推荐 根据现有论文的题目、会议、年份、作者和摘要等信息,抽取出论文的特征信息。 对于每一篇论文,找出和这篇论文相关的其他论文。 2) 由作者到论文的推荐 利用现有的学者数据,抽取出学者信息,然后对于每篇论文的作者的研究方向进行建模,利用这些信息找出其它和这篇论文相关的论文。 3) 将上面的两种结果进行综合,得到最终的推荐结果。 (2) 思路 系统设计和研究方案 2、相关论文推荐 如何基于现有的数据,抽取出有效表示论文内容的数据。 根据抽取出的论文特征数据,设计

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档