- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Bing核心搜索研发部对搜索质量的见解
题记:这是一篇来自Bing核心搜索研发部经理的一篇文章,本文讲诉了Bing的一系列功能改进,这只是一篇普通的搜索功能改进介绍,但通读本文,我们会发现,搜索引擎会把大量精力放在研究人们在搜索时犯的错、如何正确理解用户的意图、以及利用词库提供更精准的内容上面。所以卢松松相信,无论是bing、Google还是百度,都会这么做。
在Bing,我们承诺提供最好的搜索结果,虽然研究小组数据挖掘专家,在不断提供我们的核心拼写和排名算法,可现实是总有某些历史上的遗留下的缺陷,这部分是因为人们过于依赖搜索所犯的错误,在这篇文章中,我的同事BillRamsey(Bing的研发部经理),将从三个方面介绍缺陷的发生率和严重性:网址查询、追踪链接和相关搜索。
网址查询常见的错误
这是搜索缺陷的主要来源之一,涉及到我们所说的网址查询,例如“facebook”或“雅虎网站/邮箱”的查询,乍一看,你可能会认为这是一个简单的问题。毕竟搜索引擎(Bing)包含数十亿网址,找到一个匹配的网站没多少难度。但在现实中,这种类型的查询实际上相当复杂。因为我们所有人会用无数的拼写与变体。
例如,“facebook”就有上千个不同的变体,如“facebookc.om”,“facbook”,和“ww.faceboo.omc”,除了这类拼写错误外,人们并不总是知道正确的URL。例如西南航空公司是southwest,但有些人试图搜“swair”达到该公司的网页。同时,我们通常看到的网址,如“雅虎网站/邮箱”时,正确是URL是“mail.yahoo”的排列。
即使我们找出了你真正的搜索意图,但恶意网址或垃圾邮件发送者提出了另一个挑战。它们猎取顶级域名对象如coolmathgames(人实际上是为coolmath-games)的URL。
这是我们的缺陷,我们主要通过三个领域来解决这类错误的查询方法:
第一,正确识别URL,我们可以就遮挡,通过确定的网址,我们避免如包括像searscardcom垃圾结果的问题。
第二,进行模拟用户错误测试,通过数十亿的原模型,我们能够解决常见的拼写错误的网址。
第三,我们会分析,寻找像“swair”网站,使用户最终将结束预定网站“southwest”。
另一个例子,适用于机器学习模式,像“facebooklogin”的查询相当于“”,这是很常见的域名后缀输入错误。此外,像“bedbathandbeyond”输入成bedbathandbeyond。我们的模型已经适应了这些变化,会主动把搜索结果修改,下面的例子是facebook的用户:
删除多余追踪的相关链接
搜索引擎的关键功能之一,是查询执行拼写和查询扩展的组件,拼写会纠正数百个错误的查询,而搜索出现的词组(下面的查询框,表明我们改变了用户的查询),我们把这种改建作为“追索”。例如,如果你输入“关于成功英雄的事迹”,我们将显示“包括引号的成功的英雄事迹”,但我们可能只显示“关于成功的英雄和事迹”,我们会架设所有关于你的意图。
在过去,我们用同义词作为我们追踪链接的一部分,但会经常导致搜索结果偏离主题,导致同义词追踪成为多余的功能,所有我们在不断扩大“词语”的定义,帮助其用户更好的进行匹配。
所以这项功能我们已经删除,这个附加的价值不大,当Bing改变一些同义词的话,追踪链接可能不可能添加更多的有价值的信息,所以我们将搜索结果的颜色改为黑色。我们将继续努力为用户指定的搜索词语提供更好的查询。
改进相关搜索
相关搜索,这个大家很熟悉,在人们初始搜索时,我们会把相关的搜索防止搜索结果左侧,现在调整到右侧,例如搜索“布拉德·皮特”:
(注:Bing中国版还没有变,百度和Google在底部。)
有时我们会查询搜索结果的题外话。例如“AMD”会给用户提供意想不到的搜索结果,通过改善我们的相关模型。
同时,我们也取得了其他地方改进,超越有关相关搜索中的格式条款,即“KSNWeatherLab”中的“KSNWeatherLab”,(注:一些实验性项目,处于测试阶段),并避免在安全搜索中检索到成人内容。
结论:
搜索引擎的有点在于它会始终依赖于人,而人们总会有不同缺陷的,我们做的是降低缺陷率和搜索率,希望人们可以做更少的搜索并做更多的事。
作者:Dr.WilliamRamsey——bing核心搜索研发部首席开发经理
文章来源:卢松松博客本文地址:lusongsong.reed/488
rmdkoa 大同网站建设
您可能关注的文档
最近下载
- 20221109标准化管理体系 要求(审核前终版).pdf VIP
- 民兵教育教案.pptx VIP
- 人教版九年级化学上册第二单元我们周围的空气整体单元设计.ppt VIP
- The Day of the Jackal《豺狼的日子(2024)》第一季第八集完整中英文对照剧本.docx VIP
- 市政工程检测员考试试题库 .pdf VIP
- 医学保护性约束技术操作流程图.pdf VIP
- 中国历年出生人口统计-出生人口统计.docx VIP
- 认识自我 悦纳自我.ppt.ppt VIP
- 2025秋人教新目标(Go for it)版七年级上册英语教学计划.docx VIP
- 矿山排土场安全管理办法.docx VIP
文档评论(0)