[工学]全文搜索平台简介.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]全文搜索平台简介

搜索平台 2.1 公司搜索服务技术现状分析 2.2 现有搜索服务的问题及搜索平台的意义 2.3 搜索平台系统的特点 2.4 搜索平台系统的能力 2.5 搜索应用平台系统框架 2.6 搜索产品与搜索平台 2.7 后续计划 服务类型 支持频道 数据规模(条目) hits 搜索平台 生活搜索 200万 10万 视频搜索 4000万 200万 知识人 5000万 150万 WAP新闻 1000万 40万 地图搜索 1000万 10万 博客搜索 2.5亿 800万 新闻搜索 2亿 400万 2.1 公司搜索服务技术现状分析 基于自有技术,由研发维护: 新闻搜索、博客搜索 生活搜索、视频搜索 知识人与地图搜索等 Wap新闻 基于自有技术,由应用部门二次开发和维护 Wap搜索等 基于开源或外包系统,由应用部门开发和维护 论坛、圈子、相册等(基于lucence,互动) 车魔搜索(外包公司,汽车) 2.2现有问题及搜索平台的意义 节省资源:合理复用硬件资源,减少重复开发 更高品质:专注、深入、持续的改进 服务可靠:多级备份、多重监控、快速处理 更多专注:平台专注搜索相关问题,应用专注产品自身 简便易用:可以快速方便搭建、管理搜索产品 浪费资源:硬件资源利用不充分,重复学习和开发系统 简单使用:对于搜索系统只是简单使用,缺乏深入挖掘 弱化运营:缺乏完善可靠的灾备、监控、问题处理机制 不能专注:产品开发中花了大量力气处理搜索相关问题 周期过长:为了建立搜索应用需要花过长的时间 2.3 搜索平台系统的特点 提供一个平台,使得使用者的搜索需求可以快速简单地转化为搜索应用服务,关注其应用核心价值而不需关注搜索的实现与运营细节。 提供方案,可以帮助和引导用户整理清楚自身对于搜索的需求。 统一的平台可以更有效地利用硬件资源,更好地提升系统质量,从而提供更加完善可靠的系统服务。 平台对于每个搜索应用提供了完善的管理工具,用户可以获得应用的运营情况、服务当前和历史日志分析、附加的数据查询和查询推荐等服务。 2.4 搜索平台系统的能力 快速创建应用:最通用的用户需求在完成项目创建后提交数据即可完成创建,获得服务;复杂的应用在完成需求提交后2天内可完成创建,获得服务。 支持数据规模:总数据10亿以内,日更新1000万 数据上线速度:实时搜索10s以内,普通搜索1分钟以内 并发服务能力:300次/s以内可直接提供,以上需定制 定制开发能力:可以快速实现用户数据字段格式、查询需求、排序计算规则等定制,特殊应用可定制开发 2.5 搜索应用平台系统框架 用户搜索需求 WEB前端管理平台 应用数据 数据索引流程 搜索服务系统 平台运营系统 用户搜索应用服务 用户搜索应用管理 配置信息 运营数据 2.6 搜索产品与搜索平台 搜索平台系统 地图搜索产品 视频搜索产品 POI检索 公交检索 站点检索 嘉宾检索 新闻检索 播客检索 大片检索 2.6 搜索产品与搜索平台 搜索平台系统 生活信息检索 3/cgi-bin/life/srm.cgi?q=%D6%D0%B9%D8%B4%E5+%B4%A8%B2%CBf=0num=10start=0 2.7 后续计划 近期将在两个以上IDC布置系统,提高系统的容灾能力。 进一步加强搜索应用的个性化定制能力,使得应用创建者可以方便实现特殊数据更新要求、排序要求等。 建立完善的应用测试系统,使得应用用户可以快速方便地创建测试搜索应用,验证自己的产品思路。 增加更多的附属服务,例如页面分析、垃圾内容识别、分类、排重等。 加强在实时搜索的产品和技术方面的研究 基于平台做一些垂直搜索产品的预研,例如购物搜索等。 * * * *

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档