企业搜索解决的方案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
企业搜索解决的方案

猎兔()搜索技术 北京盈智星科技发展有限公司 - PAGE 1 - 电话:010企业搜索解决方案 北京盈智星科技发展有限公司 2010年11月 目录 TOC \o 1-3 \h \z \u HYPERLINK \l _Toc277947070 1 项目背景 PAGEREF _Toc277947070 \h 3 HYPERLINK \l _Toc277947071 2 需求分析 PAGEREF _Toc277947071 \h 3 HYPERLINK \l _Toc277947072 3 项目目标 PAGEREF _Toc277947072 \h 3 HYPERLINK \l _Toc277947073 4 技术方案与特色 PAGEREF _Toc277947073 \h 4 HYPERLINK \l _Toc277947074 4.1 技术方案总体图 PAGEREF _Toc277947074 \h 4 HYPERLINK \l _Toc277947075 4.2 文件信息采集(ftp\oracle) PAGEREF _Toc277947075 \h 4 HYPERLINK \l _Toc277947076 4.3 搜索引擎及中文分词 PAGEREF _Toc277947076 \h 6 HYPERLINK \l _Toc277947077 4.4 搜索应用界面 PAGEREF _Toc277947077 \h 8 HYPERLINK \l _Toc277947078 5 外部系统交互 PAGEREF _Toc277947078 \h 8 HYPERLINK \l _Toc277947079 6 环境配置 PAGEREF _Toc277947079 \h 8 HYPERLINK \l _Toc277947080 7项目管理 PAGEREF _Toc277947080 \h 9 HYPERLINK \l _Toc277947081 7.1 项目组领导机构筹建 PAGEREF _Toc277947081 \h 9 HYPERLINK \l _Toc277947082 7.2 项目执行计划设置 PAGEREF _Toc277947082 \h 9 HYPERLINK \l _Toc277947083 7.4 项目沟通机制 PAGEREF _Toc277947083 \h 11 HYPERLINK \l _Toc277947084 7.5 执行过程监管制度 PAGEREF _Toc277947084 \h 11 HYPERLINK \l _Toc277947085 7.6 技术支持与服务 PAGEREF _Toc277947085 \h 12 1 项目背景 随着企业信息化应用的深入,企业内部电子文档及数据库存储的数据不断增加,海量的电子文库和数据已经成为企业的宝贵资料库和知识库。由于文档格式迥异,存储位置不尽相同。如何高效的管理和利用这些电子信息为生产和工作服务,使企业普遍存在的一个问题。为了解决这一问题,建立和启用企业信息搜索管理平台,进而对信息进行集中管理和利用已成为一种共识。 2 需求分析 由于企业内部办公自动化和各业务分支应用系统是逐步分散建设的,信息的分布相对分散,存储方式多种多样,如Word、Excel、PPT、PDF、AutoCAD等文档以单独文件的形式保存在文件服务器内,其它业务应用软件数据保存在数据库服务器中。在调阅和查找既往的文件、通知、图纸及业务数据等历史资料时极不方便,客观上影响了资料库和知识库的利用效率,降低了原有信息的使用价值。为了加强信息库的管理,提高利用效率,更好的为企业生产和工作服务,客观上要求有一个信息管理平台,实现对信息的集中管理,并提供高效的搜索引擎,使企业内部资料的查找调阅快速简便。 3 项目目标 1)整体目标: 搭建企业FTP、ORACLE文件全文搜索平台,实现信息集中管理和统一搜索接口,实现对各种文档和相关数据库中特定信息搜集整理、形成文件信息摘要,并建立索引,支持分层分类,提供按权限和类别搜索。 2)功能目标: 定向自动抓取文件服务器和数据库服务器中文档信息,分析抽取出文件的标题、正文、路径、时间等关键信息,并集中存储,信息抓取准确完整,及时快速; 对特定信息进行索引排序,支持用户利用关键字进行站内全文快速搜索; 网站整体观感简约明快,用户使用方便灵活; 支持运营商对平台运行情况动态监控; 3)性能目标: 信息丰满渡:文档信息的描述要完整清晰,正文标题、内容摘要、路

文档评论(0)

dajia1qi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档