基于Lucene网络创作和学习资料共享平台设计-.docVIP

基于Lucene网络创作和学习资料共享平台设计-.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Lucene网络创作和学习资料共享平台设计-

基于Lucene网络创作和学习资料共享平台设计*   摘 要:为向网络文学创作者提供开放的网络信息平台,本文引入两种广泛应用的搜索引擎技术――全文索引和目录索引,基于这两种技术提出网络创作及学习资料共享平台的设计思路,并详细叙述了网络创作平台的实现。该平台采用开放源码的软件工具包Lucene,Struts2、Hibernate框架进行设计制作,并通过全文搜索、目录搜索等技术实现网络作品的发布、查阅,以及学习和交流资源的信息共享。此类共享平台的设计,为文学用户提供了参与网络创作的渠道,使文学的创作和阅读、创作与交流实现了网络互动,既丰富了文学创作的形态,也促进了网络文学的发展。 关键词:全文索引;目录索引;Lucene;Struts2;Hibernate;网络创作平台 中图分类号:TP315 文献标志码:A 文章编号:1673-8454(2013)15-0024-03 一、引言 在网络载体的传播下,文学创作中增加了“网络文学”这一信息形式。网络文学,指以互联网为展示平台和传播媒介,借助超文本链接和多媒体演绎等手段来表现的文学作品、类文学文本及含有一部分文学成分的网络艺术品。随着互联网技术的迅速发展,网络文学爱好者的不断增加极大地促进了网络文学的创作发展,也增大了文学作品的共享需求。网络文学经历了从BBS 到文学网站、博客、SNS 社区的平台形式上的转变,各种平台形式在不同时期形成各自的特点,分别扮演着不同的角色,见证了网络文学发展的整个历程。[1] 由于网络文学具有读者可直接参与创作的特性,吸引了大量的爱好者和创作者,其中就有为数不少的大学生文学创作爱好者。近年来许多文学网站的创建和个人博客的兴起,为文学创作者和爱好者提供了众多的网络平台,如晋江原创网、起点中文网、小说阅读网、榕树下等等。但由于多数文学网站面向所有文学创作爱好者,使文学作品种类和数量过多,有时某些新创作的文学作品还没被用户搜索到就已被其它类似的新作品给淹没了。如何在海量的网络文学中,搜索专门的文学作品,提高用户的搜索速率、效率,成为网络创作平台急需解决的问题。[2] Lucene是一套用于全文检索和搜寻的开源程式库,提供了功能比较强大的应用接口,能够进行全文索引和搜寻。[3]我们通过应用Java开发环境里的Lucene开源工具,进行Java资源检索库应用,设计并实现了以Struts2和Hibernate为框架的网络创作及学习资料共享平台。该平台实现了网络文学的创作和学习资料共享两方面功能,并改变传统的直接索引数据库模式,采用Lucene实现对数据库的索引并建立索引库,从而提高用户的搜索速率。 二、全文索引分析 1.全文索引模式简述 搜索引擎搜索的过程分为三个步骤:①捕获网页,每个独立的搜索引擎都有自己的网页捕获程序。网页捕获程序顺着网页中的超链接,连续地捕获网页。被捕获的网页被称之为网页快照,由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。②处理网页,搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、中文分词、判断网页类型、分析超链接、计算网页的重要度/丰富度等。③提供检索服务,用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。[4、5] 2.全文索引与目录索引技术 全文索引作为目前应用广泛的搜索方式之一,主要从互联网提取各个网站的信息(以网页文字为主),建立数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。全文索引拥有自己的网页抓取、索引、检索系统,独立的“蜘蛛”(Spider)程序,能自建网页数据库,搜索结果直接从自身数据库中调用。目录索引将目录分类的网站链接列表,用户按照分类目录找到所需要的信息,不依靠关键词进行查询,因而搜索的准确性大大提高。[6、7] 三、平台的设计与实现 1.系统结构设计 基于以上技术的分析,我们设计了基于Lucene的网络创作及学习资料共享平台。[8、9]该网络平台以Struts2和Hibernate为框架,为网络文学创作者,如大学生文学创作者和爱好者,提供免费的网络创作和交流平台。该平台分为三个模块:用户服务层模块、网络文学创作模块、数据索引模块。系统整体结构如图1所示。 (1)用户服务层模块 该层主要为进入文学平台的入口,也是为用户提供的接口。它基于B/S模式实现,系统对各类用户进行整合,使系统管理员、各用户可以跨平台访问该平台,也可利用该平台上传学习和交流资料,并共享给其他用户,提高用户在线阅读

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档