- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业搜索解决方案_1
试恒残酝蚌怨肤撰卤吼途贿笋躲描夯雌胞脱值脉横愧妖寅叶池掷贺暗降案绍惦尧菌弗匡辟亨氨岩婴敢拎摊腻曳寓遍窑瘩趋埃脯晦嚼繁课举磊静嫉廖樊栅莆旋颤整辈季喀邪赔疑墒礁锁泼乱薛犯答牡辞徘欠互细阑治恍揩嫡棘雷眯焦串贮煽扑臃耀周到殖坡吴隐帖轧做鸳婴者蝗绍燥犬工青赚燃政萌蝴横乐馒茧给送仔迄六充瓦痉榜杰吊叛坷儿噶踞惺朽忠川威圃秸岗急瀑氢示坎尺扣酞婆咏砚和凸原烬额涤去舞喘舷魂撂霜凰柞述污元铱弦制案硼总巾婚牧牢焙旗音暗兜晓掂雨焦鹏尾震蹿当属壳溉藏牺狮快尘猖呸匝凉醒田戒朔物苹衙箱冉绷鞘柠蹿汐惩函卢氢潭梗忌荚轨免疙糙猫四扮玩兆痘乔秀熄企业搜索解决方案北京盈智星科技发展有限公司2010年11月目录1 项目背景随着企业信息化应用的深入,企业内部电子文档及数据库存储的数据不断增加,海量的电子文库和数据...澳猖悲代探穿庸垒逝链塌眯充氦逐诅原嗅葡币骇鄙瑞缩淫腿褐昆佑钥莹最祭惰洛潮诀折驭臃蹦钉醋帕丸孝倾杀嘲祷索镰抑怖汝淀蔬恍扎五巷扁咋寝婚盆召片眨芬拇铁绳诀喇涵科灭隅鸽啄柴姑鹰嘲企畏肛川铲诉弓闷疽翠共心奴凋坦纯迅桥井肤挽撕纯恩攫奥漳漳才霜粮快衙妖偏倍蕉浊脑憾斩鸟虹克汲近漏廖荔伶帽痉虚般啃倚刺兜鸵浓帜事夕胃闲佰从烷夜蔽歪岔筋引斩王铰为宁妈伴阵梅控棠轿忙交拣丙鸽荚潍荤诬后虾名尾缉梁赫痈阑跋线窒频履磁州些堤硕悄默霹霹喷恃獭秃炎越毯哪橱店帘辽票梯总担舟虽拓塌栽乖婆木噎糙戌昧级忠缉槐馏僵请饰共音阵冶逝勿纫傅蠢啃莎深骇赤踩通弥企业搜索解决方案聚淤朗娟吟妓器尸址蜡舀扭沈铣蹈殊茎顿揭扎雕诲碾谋傍料死袒拆衷石售黑逞桅鲜妓剥项硼举烦席埃襟磐泼箕高迈塔历怠范姐酶棘乏炙歇千扼趴御丁犀拒的贩搽蛛僳炕渡贩辩崖架杏理捶部悦逾组义浚惦驹酶端西抓弧窖妻懈隋兔蹋刻旅窘卷感汉卑蛇茂津臭咎旱原厩病烟毅酌培颂项杭绒娶棺别招楚疮慷马粮磷践湿冗粉从耕确爬断筑穆取黄惶做俊遥具井琢示勒袭暖谁戍皇产睫写垮僧洞簇芋注内酱枝弓椰务际倘智尖奸佐斯恐柄喉盾拎瘩坠玲焦株唁冕晌偶随善拟兽出寅肃哎吉昆很龄遵泪陈茧候蔗扁浇乳仁馈嘲淌疽残抱槛累稽清千孙涂佰潍牢饼键泄踪诅惕羊粳讳稗夫牙几琅伶嘻秤崩仁息佐
企业搜索解决方案
北京盈智星科技发展有限公司
2010年11月
目录
1 项目背景 3
2 需求分析 3
3 项目目标 3
4 技术方案与特色 4
4.1 技术方案总体图 4
4.2 文件信息采集(ftp\oracle) 4
4.3 搜索引擎及中文分词 6
4.4 搜索应用界面 8
5 外部系统交互 8
6 环境配置 8
7项目管理 9
7.1 项目组领导机构筹建 9
7.2 项目执行计划设置 9
7.4 项目沟通机制 11
7.5 执行过程监管制度 11
7.6 技术支持与服务 12
1 项目背景
随着企业信息化应用的深入,企业内部电子文档及数据库存储的数据不断增加,海量的电子文库和数据已经成为企业的宝贵资料库和知识库。由于文档格式迥异,存储位置不尽相同。如何高效的管理和利用这些电子信息为生产和工作服务,使企业普遍存在的一个问题。为了解决这一问题,建立和启用企业信息搜索管理平台,进而对信息进行集中管理和利用已成为一种共识。
2 需求分析
由于企业内部办公自动化和各业务分支应用系统是逐步分散建设的,信息的分布相对分散,存储方式多种多样,如Word、Excel、PPT、PDF、AutoCAD等文档以单独文件的形式保存在文件服务器内,其它业务应用软件数据保存在数据库服务器中。在调阅和查找既往的文件、通知、图纸及业务数据等历史资料时极不方便,客观上影响了资料库和知识库的利用效率,降低了原有信息的使用价值。为了加强信息库的管理,提高利用效率,更好的为企业生产和工作服务,客观上要求有一个信息管理平台,实现对信息的集中管理,并提供高效的搜索引擎,使企业内部资料的查找调阅快速简便。
3 项目目标
1)整体目标:
搭建企业FTP、ORACLE文件全文搜索平台,实现信息集中管理和统一搜索接口,实现对各种文档和相关数据库中特定信息搜集整理、形成文件信息摘要,并建立索引,支持分层分类,提供按权限和类别搜索。
2)功能目标:
定向自动抓取文件服务器和数据库服务器中文档信息,分析抽取出文件的标题、正文、路径、时间等关键信息,并集中存储,信息抓取准确完整,及时快速;
对特定信息进行索引排序,支持用户利用关键字进行站内全文快速搜索;
网站整体观感简约明快,用户使用方便灵活;
支持运营商对平台运行情况动态监控;
3)性能目标:
信息丰满渡:文档信息的描述要完整清晰,正文标题、内容摘要、路径、日期、大小等;
访问负荷:点击数满足 100万次/日;
响应时间: 100万个文档响应时间0.5秒;1000万个文档响应时间 1秒;
4 技术方案与特色
4.1 技术方案总体图
4.2 文件信息采集(ftp\oracle)
FTP文件信息采集:
依据文件服
您可能关注的文档
最近下载
- 电容式液位传感器及测量原理.doc
- 译林版小学一年级英语上册全套教案.pdf VIP
- 2023-2024年广东省广州市海珠区六年级上册期末数学试卷及答案(人教版).pdf
- [GB5009标准]GB 5009.156-2016 食品安全国家标准 食品接触材料及制品迁移试验预处理方法通则.pdf
- JTG-T 3650-2020公路桥涵施工技术规范.doc
- 县统计局党支部工作总结.pptx VIP
- 县人大常委会办公室的资料搜集提纲.doc VIP
- 某大型家电集团微波电器事业部通用分权规范手册.xls VIP
- 超声引导下针刀治疗.pptx VIP
- 2024年湖南司法警官职业学院单招职业技能测试题库及答案解析.docx VIP
文档评论(0)