- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北大畢业论文基于PARADISE平台论文检索系统
PAGE \* MERGEFORMAT 4
本科生毕业论文
题目:基于PARADISE平台论文检索系统 Literature Search Design based on PARADISE
姓 名: 李峰
学 号:
院 系: 信息科学技术学院
专 业: 计算机科学与技术系
指导教师: 闫宏飞 副教授
TIME \@ EEEE年O月A日 二〇一三年十二月二日
摘要:
本文基于天网实验室的HYPERLINK /src/paradise/Platform for Applying, Researching And Developing Intelligent Search Engine (PARADISE)搜索引擎平台,通过以从抓取的计算机网络方向的2500多篇论文为数据,搭建成一个论文搜索系统,最终目的是通过论文之间的引用关系,获得其他引用这篇论文的作者对这篇论文的评价,形成一个小的评价段落,以及Impact-based Summaries,从而使得我们能够从专业级的角度获得这篇论文的内容以及优劣。我们首先根据上面抓取了文章之间的引用关系,然后通过一个算法获得了对一篇文章评价的候选句子集,根据这些句子的重要程度进行排序,获得一个评价短文。并且构建了一个语言模型,通过这些候选句子集对原文的句子进行评分,取得分最高的几个句子,获得原文基于影响的概括。
关键词
搜索引擎, 论文评价, 语言模型, KL-divergence算法, 基于影响的概括
Abstract
In this paper, based on the PARADISE (Platform for Applying, Researching and Developing Intelligent Search Engine) and the data of 2500 paper in area of computer network, we construct a search engine of papers. Our goal is to get the comment and impact-based summaries of one paper based on the reference relations between the papers. We firstly get candidate sentence which comment on the previous paper and generate a citation context. Then we construct a Language Model, through the citation context, we can score the sentence in the previous paper, and get the impact-based summaries.
Key words
Search Engine, Paper Comment, Language Model, KL-divergence Scoring, Impact-based Summaries
目录
TOC \o 1-3 \h \z \u HYPERLINK \l _Toc230930685第1章 引言 PAGEREF _Toc230930685 \h 1
HYPERLINK \l _Toc2309306861.1研究背景 PAGEREF _Toc230930686 \h 1
HYPERLINK \l _Toc2309306871.2工作内容 PAGEREF _Toc230930687 \h 2
HYPERLINK \l _Toc2309306881.2.1抓取所需要的论文数据 PAGEREF _Toc230930688 \h 2
HYPERLINK \l _Toc2309306891.2.2获得一篇论文的评价并较好的显示出来 PAGEREF _Toc230930689 \h 2
HYPERLINK \l _Toc2309306901.2.3获得一篇论文基于影响的总结段落 PAGEREF _Toc230930690 \h 3
HYPERLINK \l _Toc2309306911.2.4基于PARADISE平台搭建搜索平台 PAGEREF _Toc230930691 \h 3
HYPERLINK \l _Toc2309306921.3实验的意
您可能关注的文档
- 北京城市客運交通枢纽存在的问题及分析.doc
- 北京大學无线局域网络的设计和成功实现.doc
- 北京城市病與保定的关系.doc
- 北京大學法学硕士的发展前景.doc
- 北京城市交通協同管控的若干问题研究.doc
- 北京大學网络教育学院2014年秋季社会调查与研究方法网上作业试题和答案.doc
- 北京大學西方文明史芭蕾舞精神美的意境(一).doc
- 北京大學生心境状况与特点的研究.doc
- 北京奧运物流供应链系统浅析(本科.doc
- 北京市元代旅游產品开发的建议与对策.doc
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)