- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[计算机软件] 基于PARADISE平台的论文检索系统 本科生毕业论文推荐
本科生毕业论文
题目:基于PARADISE平台的论文检索系统Literature Search Design and Implementation based on PARADISE
姓 名:
学 号:
院 系: 信息科学技术学院
专 业: 计算机科学与技术系
指导教师:
二○一一年七月二十八日
摘要:
本文基于天网实验室的Platform for Applying, Researching And Developing Intelligent Search Engine (PARADISE)搜索引擎平台,通过以从抓取的计算机网络方向的2500多篇论文为数据,搭建成一个论文搜索系统,最终目的是通过论文之间的引用关系,获得其他引用这篇论文的作者对这篇论文的评价,形成一个小的评价段落,以及Impact-based Summaries,从而使得我们能够从专业级的角度获得这篇论文的内容以及优劣。我们首先从上面抓取了文章之间的引用关系,然后通过一个算法获得对一篇文章评价的候选句子集,根据这些句子的重要程度进行排序,获得一个评价短文。并且构建了一个语言模型,通过这些候选句子集对原文的句子进行评分,取得分最高的几个句子,获得原文基于影响的概括。
关键词
搜索引擎, 论文评价, 语言模型, KL-divergence算法, 基于影响的概括
Abstract
In this paper, based on the PARADISE (Platform for Applying, Researching and Developing Intelligent Search Engine) and the data of 2500 papers in area of computer network, we construct a search engine of papers. Our goal is to get the comment and impact-based summaries of one paper based on the reference relations between the papers. We firstly get candidate sentences which comment on the previous paper and generate a citation context. Then we construct a Language Model, through the citation context, we can score the sentence in the previous paper, and get the impact-based summaries.
Key words
Search Engine, Paper Comment, Language Model, KL-divergence Scoring, Impact-based Summaries
目录
第1章 引言 5
1.1研究背景 5
1.2工作内容 2
1.2.1抓取所需要的论文数据 2
1.2.2获得一篇论文的评价并较好的显示出来 2
1.2.3获得一篇论文基于影响的总结段落 3
1.2.4基于PARADISE平台搭建搜索平台 3
1.3实验的意义 3
第2章 数据的收集 5
2.1如何提取数据 5
2.2数据抓取的过程 6
2.3数据的存储及解析 7
第3章 生成评论集 10
3.1获得评价的候选句子集 10
3.2获得评论段落 11
第4章 建立模型并生成基于影响的概括 13
4.1建模之前我们所有的数据 13
4.2建模算法 13
4.3算法的实现 14
4.4获得基于影响的概括 15
第5章 搭建搜索引擎 16
5.1 PARADISE结构简介 16
5.2修改索引部分 17
5.3修改前台部分 18
5.4系统示意图 19
5.4.1主界面 19
5.4.2搜索结果界面 20
5.4.3评论界面 21
第6章 实验结果与分析 22
6.1实验结果 22
6.2具体分析 22
第7章 后续工作 26
第8章 致谢 27
参考文献 28
第1章 引言
1.1研究背景????
如今,全世界范围内学术活动日益积极,所产生的论文也在不断增多,因此,如何搜索到自己所需要的论文,以及自动获取一些关于论文的信息,是客观需要的。学术检索,绝不简简单单的检索出所要查找的论文,这样就和普通的通用搜索引擎如Google等一样了。学术检索,应该更侧重
您可能关注的文档
- [硕士论文]对超女现象营销模式的研究与思考推荐.pdf
- [硕士论文]数据采集及处理系统设计推荐.pdf
- [管理工程类] 招投标课程设计实验报告推荐.doc
- [艺术设计类] 临沂蓝玫瑰华星钻石首饰公司VI设计 毕业论文推荐.doc
- [计算机网络概论电子教案]第十章 Internet接入技术推荐.ppt
- [计算机设计] 基于.NET的玉器交易网推荐.doc
- [计算机设计] 基于JAVA的餐饮管理系统(毕业论文)推荐.doc
- [计算机] VI识别系统设计 毕业设计论文推荐.doc
- [计算机设计] 图书管理系统毕业论文推荐.doc
- [计算机设计论文] C#--翻牌游戏推荐.doc
- 安徽省A10联盟2025届高三下学期原创夺冠卷(三)数学试题.docx
- 医疗行业环保政策要求与2025年绿色医疗产业政策实施效果评估.docx
- 蓝色经济区2025年海洋生态环境保护与海洋生物资源养护战略研究.docx
- 2025届贵州省毕节市高三四模语文试题.docx
- 行政管理优秀案例试题及答案.docx
- 蓝色经济区2025年海洋生态环境保护与海洋生物资源养护报告.docx
- 行政管理优秀案例及试题及答案.docx
- 蓝色经济区2025年海洋生态环境保护与生态旅游发展报告.docx
- 2025年互联网医疗平台商业模式创新趋势及用户体验升级报告.docx
- 数字化转型背景下2025年企业数据治理体系与数据治理方法论研究.docx
最近下载
- (6篇)护林员业务培训班领导讲话.pdf VIP
- Public Opinion-李普曼《公众舆论》英文原版.doc
- 化学_年产1亿片盐酸二甲双胍缓释片生产工艺设计.docx
- 城市社区公共卫生服务绩效管理研究——以常州市为案例.pdf
- 纪金莲版税法 第7章 财产类税法 课件.pptx
- (新课标)新高教版中职(英语2 基础模块)Unit 7 Invention and Innovation 《Reading and Writing》说课稿.doc
- 纪金莲版税法 第4章 关税法 课件.pptx
- 纪金莲版税法 第8章 资源类税法 课件.pptx
- 大体积混凝土施工培训课件.pptx
- 纪金莲版税法 第9章 行为目的类税法 课件.pptx
文档评论(0)