基于HeritrixSolr的农业信息垂直搜索引擎研究与设计-广东农业科学.PDF

基于HeritrixSolr的农业信息垂直搜索引擎研究与设计-广东农业科学.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
广东农业科学 2015 年第 5 期 139 基于Heritrix+Solr 的农业信息垂直 搜索引擎研究与设计 1,2 3 4 1,2 1,2 郭承坤 陈国松 阮怀军 陈英义 屠星月 1. 中国农业大学信息与电气工程学院袁北京 100083 曰2. 农业部农业信息获取技术重点实验室袁北京 100083 曰 3. 山东水利职业学院袁山东日照 276826 曰4. 山东省农科院科技信息研究所袁山东 济南 250100 冤 要 随着农业信息化尧智能化的不断发展袁农业信息量呈现井喷式增长袁为广大农业从业者和农业科 研人员提供便捷有效的信息检索方法是目前农业搜索引擎亟需解决的问题遥 为此袁 本文提出了基于 Heritrix+ Solr 的农业信息垂直搜索引擎框架袁并设计了适用于农业信息垂直搜索引擎的隐马尔科夫 Web 信息抽取模块 和基于词典的mmseg4j 中文分词模块袁同时改进了页面排序算法袁对进一步提升农业垂直搜索引擎的用户体验 和工作效率具有一定的参考价值遥 关键词 农业垂直搜索引擎曰 Heritrix 曰 Solr 曰 中文分词曰 页面排序 中图分类号 G203 文献标识码 A 文章编号 1004-874X 2015 冤05-0139-06 Research and design of agricultural information vertical search engine based on Heritrix+Solr 1,2 3 4 1,2 1,2 GUO Cheng-kun , CHEN Guo-song , RUAN Huai-jun , CHEN Ying-yi , TU Xing-yue (1.College of Information and Electrical Enginee ring, China A gric ultural Unive rs ity, Be ij ing 100083, China; 2.Key Laboratory of A gric ultural Information A cquis ition Tec hnology, Ministry of A gric ulture, Beij ing 100083,China; 3.Shandong W ate r Polytec hnic, Rizhao 276826, China; 4.Institute of Information Technology, Shandong A cade my of A gric ultural Scie nces , Jinan 250100, China) A bstract: T he agricultural information blooms rapidly w ith the development of agriculture in information and intelligence, therefore, a convenient and effective agricultural information search method and search engine for agricultural r

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档