B2c网站站内搜索系统初探(11页)---写给不懂技术的你.pdfVIP

B2c网站站内搜索系统初探(11页)---写给不懂技术的你.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
来自: by 虫子 B2c 站内搜索初探—写给不懂技术的你 这之前: 1、想写这篇文章很久,但一直纠结在搜索引擎具体的技术原理细节中,看得愈多,不懂的 地方也愈多,迟迟不敢动手,这是非程序猿出生的痛苦。 2、所有人都知道搜索是个复杂的玩意,本文试着主要从非技术角度思考并搭建一个适用于 b2c 网站的站内搜索系统,不涉及到太多的技术细节。至于具体的实现代价这里未做考虑(是 通过简单的sql+缓存搞定、用lucene 或Sphinx 等全文检索引擎做二次开发、甚至找google 百 度买代码做二次开发,听你们程序猿的吧,你做不了主)。 3、本文多次提到站内搜索,而非站内搜索引擎,这两者间有巨大差别 (我不是很确定最终 设计出来的是否会是一个真正意义上的站内搜索引擎)。 4 、本文参考了较多资料,例举如下,供参考学习 《web 信息架构-设计大型网站》这本经典书籍(不建议新手购买) 以及部分关于全文检索的论文 在这之后,我们进入正文 1、在开始考虑规划一个b2c 站内搜索前,需要考虑清楚以下2 个问题 站内搜索要解决的问题 下面描述3 类常见的搜索场景 (1)某用户小李, (2 )某用户小白,听说了b2c 网站A ,看见琳琅满目的商品 (3 )某用户小明,上次来过了网站 分析你的网站是否需要站内搜索 实际上现在站内搜索在b2c 网站基本是标配,但这里仍然唠叨一下网站是否需要站内搜索, 或仅仅是搜索而不引擎? (1)考虑网站商品的属性:以标准品、常见商品为内容的站点搜索使用率会高;而较偏门 的商品,如绣刺、礼品这类 B2C 网站,用户对要搜索的关键词认知不够,大部分用户建立 不起较清晰的心智模型,搜索使用率会偏低。 (2 )考虑网站可能使用站内搜索用户的绝对数,10 万级别UV/ 日的网站,站内搜索使用用 户的数量已经比较可观了,需要考虑他们的需求。 (3 )考虑商品类目数量、品牌数、sku 数量,根据一点小小的经验,单品牌 sku 小于 500 的服装类网站站内搜索使用率远小于5% 。 (4 )考虑客户重购率、购买周期(其实本质是考虑新客老客的组成),新客为主的用户,基 本是试探性搜索,搜索使用率也偏低。 来自: by 虫子 总结一下:商品偏门、流量不高、sku 少、新客为主的站点,站内搜索基本是摆设,即使要 上站内搜索,亦可简单应付。 这里要提到一点:很多客服经常自己需要用商品款号搜索商品,认为非常需要站内搜索,这 不是用户需求,只能说明后端系统没做好。 2、简单了解搜索引擎的工作原理 爬虫抓取内容建立(包括新增和删减)索引—储存索引—查询 (用户查询)查询分 析—查询结果排序呈现结果 (1)要提到的是,电子商务的信息通过手工录入或其它方式已经导入到了系统,不需要用到爬 虫程序。 (2 )所谓索引,是指搜索系统对信息进行加工,把信息转换成搜索系统能快速理解并方便查询 的过程。要多哪些内容建立索引、对哪些内容的组件进行索引,是下文要探讨的方向。 (2 )查询分析,这是最有技术含量的部分、涉及到搜索引擎的核心算法,对于中文全文检索, 这里又涉及到所谓的分词技术。 比较复杂,下文亦会做简单解说。 (3)查询结果排序,这也是较复杂的部分,排序方式多种多样。最常见并合理是“根据搜索关键 词的相关性”进行排序,什么是最相关的搜索结果?对同一个关键词,每个人的理解可能不一样, 而要通过程序去理解并判定,技术含量可见一斑。最著名的是 Google 首创的 page rank 排名 运算法则。下文也将对b2c 的排名算法做简单阐述。 (4 )搜索结果呈现,对不懂技术的人来说,这是最容易把握,并指点江山的部分。下文会做重 点阐述。 为了便于区分什么是站内搜索,什么是站内搜索引擎,这里贴一张分析表格(出处不详): 来自: by 虫子 3、考虑清楚这两个问题后,你决定要上站内搜索了,那么接着考虑以下几个问题 接上一篇文章 让用户搜什么内容? 比较明显,一般b2c 网站的内容就是商品、外加部分新闻公告和帮助文章。对于平台性的网 站,如淘宝和京东,因为支持店中店,内容还包括店铺和品牌。内容虽然简单,一般是是会 简单的对内容做“搜索分区”,分区的目的是不让用户在同一个搜索结果列表既看到商品展 示、又看到文章和店铺的展示。 淘宝商城有两个分区:商品和店铺 168

文档评论(0)

专业好文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6110200002000000

1亿VIP精品文档

相关文档