微软企业级网站搜索解决方案.pptxVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微软企业级网站搜索解决方案

基于Microsoft Office SharePoint Server 2007的微软企业级网站搜索解决方案解决方案综述微软企业级网站搜索解决方案 ,基于SharePoint强大的搜索引擎,支持对各种形态的Web站点内容的搜索爬取基于Form认证的网站爬取基于图片数字认证的网站爬取使用Ajax技术的网站大量通过Javascript生成链接的网站适用场景企业内外门户的搜索引擎竞争情报分析系统的搜索引擎内容提要客户面临的挑战解决方案介绍 应用场景解决方案架构实现流程关键技术解决方案的商业价值企业级Web站点搜索引擎面临的问题形态多样的Web站点给爬网带来的困难现在很多网站都是基于各自的Forms验证,该如何爬取?有很多网站在基于Forms基础上还提供了数字图片认证方式,由该如何爬取?有很多网站为了提供各种动态效果使用了Ajax技术,这又该如何爬取?网站有大量链接都是通过JavaScript生成的,如何爬取呢?应用场景举例基于Forms认证及图片数字认证的网站基于Ajax技术的网站Crawling Result解决方案架构Crawling Result解决方案实现流程WebPartCrawling ConfigCrawled LogTarget sites for CrawlingForm authentication enabled Digital image authenticationWeb.Config3Search Center ContentSearch Results 1 CrawlerConnectString in“crawlconfig.xml”2 Task Queue64MOSS 2007SharePoint Search ServiceDBSharePoint Document LibCrawling Results List5关键技术爬网模块WinForm + .NET2.0 Webbrowser Control+MSHTML Control使用基于WinForm能充分利用windows的消息循环及其多线程机制。使用.NET2.0 Webbrowser Control获取网页,可以利用IE内核快速实现高效爬网网页分析基于IE内核的MSHTML 控件数字图片认证模块采用“Otsu阈值算法”二值化图片预处理采用“欧氏最小距离法”聚类分析识别图片数字爬网配置模块WebPart开发及数据库的读取使用WebPart开发模板控件,快速开发WebPart使用MenuTemplate、SPGridView类实现与SharePoint Search Service的无缝集成在wss_minimaltrust.config文件中添加节点SecurityClass Name=SqlClientPermission Description=System.Data.SqlClient.SqlClientPermission, System.Data, Version=1.0.5000.0, Culture=neutral, PublicKeyToken=b77a5c561934e089/实现对数据库的读写模板控件下载地址:/Lists/List2/Attachments/24/VSeWSS-new%20version.zip部署场景:小型部署一台搜索服务器同时提供搜索引擎所需的各项功能部署场景:中型部署3台搜索服务器分别提供搜索引擎所需的各项功能支持更多并发用户部署场景:大型部署多台搜索服务器分别提供搜索引擎所需的各项功能横向扩展的性能支持更多并发用户解决方案的优势及商业价值高效省时安装方便,提供安装程序,傻瓜式的安装步骤。类似Microsoft SharePoint 2007内置爬网配置界面,使得配置操作简单明了。基于Windows Service的爬网引擎,控制管理变得非常容易。IT优势通过WePart与SharePoint Document Library的良好支持,实现了与Microsoft SharePoint 2007无缝结合。源代码开放完全开放源代码,可以方便扩展及完善。信息资源增加通过本解决方案可以获取Internet上更多的有价值信息快速实现企业内异架构系统的信息发现企业内不同平台架构的信息可以通过本解决方案快速的集中到SharePoint搜索中心? 2006 Microsoft Corporation. All rights reserved.This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.? 2006 Microsof

文档评论(0)

153****9595 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档