全文检索系统整体方案设计.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
. 1 全文检索系统案 1.1 全文检索需求 1) 系统提供模糊检索、 分类搜索、 高级复合搜索、 全文检索、 图片容检索、 跨库检索等多种检索途径; 2) 支持字索引和词索引; 3) 检索条件具有完整的关键词布尔逻辑运算 AND 、OR 、NOT 能力,支 持复合式布尔逻辑运算查询,并且可以配合多组左括号 ( 与右括号 ) 作关键词查询优先级的设置; 4) 提供用户多次递进查询的功能, 用户可根据上一次查询关键词得到的检 索结果集,增加查询关键词与缩小搜索日期围,而得到更准确的查询结 果集; 5) 能够支持对以上文件中的中文(简体 / 繁体)、英文、日语、语容实现关 键字检索; 6) 支持对 Word 、TXT 、PDF 等多种主流文档格式全文检索,并提供开发 接口以支持特殊文档格式的全文检索; 7) 在数据源数据发生更新时,能在索引库中反映出来,保证搜索的信息为 最新,即支持增量索引机制; 8) 用户可自行设定时间,让系统自动定时进行更新索引; 9) 对于百万级记录数的搜索以及结合模糊搜索等查询式, 搜索时间不得超 过 10 秒; 10) 提供跨数据源、数据格式的搜索; 专业资料 . 11) 同过相关性搜索,能够把和搜索条件相关联的信息搜索出来; 12) 不但能够对图片的描述信息进行搜索,还能对图片容的检索; 13) 提供 COM 与 SOAP 的搜索接口 (Interface) 可让其它应用程序或查询 网页能够提供用户查询入口和查询结果的呈现, 用户可通过应用程序或 浏览器访问全文检索服务器,提交查询条件,可在浏览器中查看检索结 果; 14) 查询结果集中应包含结果集总数、命中的结果文件的完整路径,以及符 合关键词出现的容片断; 15) 在搜索结果集中,关键词应被标识出来,用特殊的字体及颜色和其他文 字进行区别, 查询者可在查询结果片断中一目了然的看到关键词出现的 位置; 16) 查询结果可按照关键词命中次数,命中结果文件的修改时间,大小等条 件进行排序; 17) 可提供用户对检索命中结果文件在索引库中进行标记,从而再次检索 时,不在标记过的文件中进行查询; 1.2 全文检索系统总体案 系统将采用以下全文检索流程。 专业资料 . Folder/ Fuzzy Search Share Folder Synonym Phrase IRMS with Documents Wild-Card Term Extract Multi-field Filter Term Index

文档评论(0)

小仙女 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档