第2代搜索软肋凸现第3代搜索渐露端倪(好文章).docxVIP

第2代搜索软肋凸现第3代搜索渐露端倪(好文章).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2代搜索软肋凸现第3代搜索渐露端倪(好文章)

发信人:?niepan?(浴火涅槃),?信区:?Search标??题:?第二代搜索软肋凸现?第三代搜索渐露端倪发信站:?瀚海星云?(2006年09月06日13:11:25?星期三),?站内信件?WWWPOST????被喻为创新机器的Google,连同盛极一时的古格尔教(Google宗教),正在全球范围内经历一个不可逆转的去魅过程。Google还在创新吗?面对诸多创意迭出的第三代搜索引擎的出现,PageRank?算法——Google所赖以成名的利器,似乎并没有给我们提供一个比其他搜索引擎更相关或者呈现方式更好的搜索结果。????比如说,在Google搜索框输入关键字查询,搜索结果往往会是数目多到目不暇接的一个个网页,除了提供的网页数日甚一日的多之外,你很难发现所搜索的结果和一年前有何分别。并且,呈现在你面前的这些网页几乎是没有经过任何处理的,比如自动分类、聚类、关联、个性化呈现等等。此外,当PageRank算法用于决定由大量社区内容、个人主页、blog组成的网页的相关性时,也越来越显得捉襟见肘,因为这些微内容的相关性排序很难套用PageRank算法。第二代搜索的软肋????作为Google排名运算法则(排名公式)的核心,PageRank算法假定:某个网页被链接得越多,则该网页的等级和重要性就越大,从而在相关性排序中也就越靠前。PageRank的等级以PR值计算,PR值越高说明该网页越重要。虽然Google的排名算法实际上要远为复杂,比如还揉合了Title标识、Keywords标识等上百个参数和变量,但囿于关键词搜索本身的局限,Google并没有在搜索结果的相关性等指标上与其竞争对手拉开距离,如果不是有所不如的话。????事实上,第二代搜索引擎所具有的局限性,Google几乎无一幸免。????大体而言,第二代搜索的局限见于如下四个方面:????其一,提供的提问函数相当有限。例如,雅虎只提供与、或运算,并且一旦选用了一个逻辑运算符,即必须应用于所有的关键词;再如,百度搜索仅支持与、或、非布尔表达式,而不支持异或,也不支持关键词之间的位置检索或者勾选搜索结果;????其二,仅支持单个关键词或者一组关键词及逻辑运算符组成提问,而并不支持自然语言搜索或语义搜索。以百度为例,百度搜索支持字串搜索,当用户输入一段话进行查询时,百度会将其切分成多个词,按照逻辑“与”的关系进行关键词搜索,但搜索结果充其量仅能做到差强人意。所以如此,是因为关键词搜索本身并不是基于对内容的理解,所以关键词与搜索结果之间的匹配很难做到精准,往往是搜到哪算哪。其三,不能利用历史信息进行搜索。用户的每次搜索都是从头开始,而不能从原有的查询结果中作进一步选择;????其四,呈现方式单一、呆板。多数搜索引擎只返回一个长长的搜索结果列表,其中可能有数以万计的包含关键词的网页,但这些网页是否以及在多大程度上与用户的搜索意图相关,则不得而知。Google的颠覆者?????在看到pagerank的局限性以后,一些新兴的搜索公司开始尝试通过提供更精准、更个性化的搜索结果,从在呈现方式上数年一贯制、几无创新的Google那里抢夺市场份额。????例如Clusty,该公司通过借鉴Autonomy的模式识别技术以及自动分类等功能,可基于对概念的理解提供搜索结果的自动分类等功能。此外,像Grokker、Snap、Dogpile这样的后起之秀,也纷纷以更个性化的搜索结果呈现方式为招徕,连连攻城掠地。???最近在美国颇受用户赞誉的另一个搜索引擎swicki,也在个性化和精准搜索方面可圈可点。虽然swicki的大部分内容来自Google,但同样是针对关键词,swicki可以根据用户注册时的使用偏好、搜索习惯,提供出不同的搜索结果。通过对搜索结果的二次评判,swicki还可以逐步校正搜索结果列表。????在国内,除了类似bbmao这样的社会化搜索引擎开始提供自动分类、聚类、用户收藏等功能而崭露头角外,老牌搜索厂商雅虎中国,也在搜索算法和呈现方式上进行了诸多改进,不仅强化了对社区内容、blog等微内容的数据抓取,而且在个性化呈现、模糊搜索等方面也有较大举措。????一个例子是,此前一个月,雅虎中国、雅虎全球、阿里巴巴三方联合推出了一个具有智能模糊匹配功能的搜索引擎——雅虎Imatch。据称,该系统可以根据用户的搜索习惯和意图,智能匹配相关的搜索结果。呈现方式的革命????Clusty、bbmao等元搜索引擎的自动分类、聚类功能一出,即大受用户追捧,专家也认为其提供了比之Google更精准、细分的呈现方式,殊不知Clusty、bbmao等所提供的自动分类、聚类功能本身一点都不新鲜。早在10年前,英国的企业搜索巨擘Autonomy已经提供了同类乃至更智能的呈现方式。????例如,Autonomy基于某种专有

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档