网站大量收购闲置独家精品文档,联系QQ:2885784924

《richbox架构演进_张勇》.pdf

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《richbox架构演进_张勇》.pdf

Richbox系统架构演化 作者:张勇(SuperMan) 什么是Richbox? A. 推⼲ B. NBA Box C. 搜索结果 D. 新闻BOX E. 搜索历史 F. ⼲告 G. 还在搜 H. 其它.. 什么是Richbox? ⾃然搜索结果和Richbox对⽐ ⺴⻚⾃然搜索 RichBox 后台数据 依照爬⾍爬取的 通过如开放平台收录,垂直引擎 收录,第三⽅数据收录的 ⽤户体验 通⽤的标题,摘要,链接富态化展现,结构化数据的表 模板 达,减少⽤户信息查询的深度。 数据结构 标准化数据(标题;摘多样的结构化数据。 要;时间,anchor等) 排序⽅法 BM25等⽂本相关性算法 基于数据挖掘的排序 查询词覆盖 覆盖所有查询词 依照重要程度,依次覆盖 4 如何做好它? ➢ 分需求分类做好 ➢ 避免引⼊其他伤害(噪⾳) ➢ 扩⼤召回 ➢ 多意图识别 ➢ solution体系(知识图谱) ➢ 各种优化召回率、准确度、Ranking... 5 不过? CGI QPU/QRW RBU/Broker Merge APPB SBU Combo OpenSE VDAP 其他 我们今天要讲的是? ‣ Web 架构的演化过程 ‣ 数据接⼊平台到开放平台的演进 ‣调查: 1 、Web开发 2 、后台开发 3 、Devops? 巨⼈的肩膀 Memcached 我们是从这⾥开始的 问题与挑战 • ⽤户越来越多 • DNS不准? • ⽤户反映访问速度慢 • ⼤家都⽤专线? 折腾 • 利⽤⾃建IP库 • ⾃建智能DNS • 搭建测速系统 • 优化⺴络层:慢启动窗⼝、超时重传、RTO、快速重传等 • 搭建堡垒系统 • 优化⺴络路径 回到Web端 原始状态 问题与挑战 原始状态 ‣ 响应时间经常超过1秒甚⾄2秒(server端) ‣ Memcache timeout (1s) 解决办法 原始状态 socket ‣ 使⽤socket+Me

文档评论(0)

ycwf + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档